新酷產品第一時間免費試玩,還有眾多優質達人分享獨到生活經驗,快來新浪眾測,體驗各領域最前沿、最有趣、最好玩的產品吧~!下載客戶端還能獲得專享福利哦!

本文來自太平洋電腦網

有時我們需要從網站獲取一些數據chatgpt 抓取網站數據,傳統方法是通過復制粘貼,直接粘到里。不過由于網頁結構不同,并非所有的復制都能有效。有時即便成功了,得到的也是“死數據”,一旦后期有更新,就要不斷重復上述操作。能否制作一個隨網站自動同步的表呢?答案是肯定的,這就是里的 功能。

1。 打開網頁

下圖這個網頁chatgpt 抓取網站數據,是中國地震臺網的官方頁面()。每當有地震發生時,就會自動更新到這里。既然我們要抓取它,就要首先打開這個網頁。

chatgpt 抓取網站數據_抓取網站數據庫_抓取網站數據

首先打開要抓取的網頁

2。 確定抓取范圍

打開,點擊“數據”→“獲取數據”→“自其他源”,將要抓取的網址粘貼進來。此時 會自動對網頁進行分析,然后將分析結果顯示在選框內。以本文為例, 共分析出兩組表格,點擊找到我們所需的那個,然后再點擊“轉換數據”。片刻后,就會自動完成導入。

chatgpt 抓取網站數據_抓取網站數據庫_抓取網站數據

建立查詢chatgpt 抓取網站數據,確定抓取范圍

3。 數據清洗

導入完成后,就可以通過 進行數據清洗了。所謂“清洗”說白了就是一個預篩選過程,我們可以在這里挑選自己所需的記錄,或者對不需要的列進行刪除與排序操作。其中右鍵負責刪除數據列,面板中的“保留行”用來篩選自己所需的記錄。清洗完成后,點擊左上角的“關閉并上載”即可上傳。

抓取網站數據庫_抓取網站數據_chatgpt 抓取網站數據

數據“預清洗”

4。 格式調整

數據上傳后,可以繼續進行格式化處理。這里的處理主要包括修改表樣式、文字大小、背景色、對齊、行高列寬,添加標題等等,通俗點說就是一些美化操作,最終我們便得到了下圖這個表。

抓取網站數據庫_抓取網站數據_chatgpt 抓取網站數據

對表格進行一些美化處理

5。 設置自動同步間隔

目前表格基礎已經完成,但和復制粘貼一樣,此時得到的仍然只是一堆“死數據”。想讓表格自動更新,需要點擊“查詢工具”→“編輯”→“屬性”,并勾選其中的“刷新頻率”和“打開文件時刷新數據”。處理完成后,表格就可以自動同步了。

抓取網站數據_抓取網站數據庫_chatgpt 抓取網站數據

設置內容自動同步

注:默認情況下數據刷新會導致列寬變化,此時可以點擊”表格工具“→“外部表數據”→“屬性”,取消“調整列寬”前面的復選框解決這個問題。

chatgpt 抓取網站數據_抓取網站數據_抓取網站數據庫

防止更新時破壞表格式

寫在最后

這個技巧很實用,特別是在制作一些動態報表時,能夠大大減輕人工提取所產生的麻煩。好了,這就是本期要和大家分享的一個小技巧,是不是很有用呢!

免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表本站的觀點和立場和對其真實性負責。如需轉載,請聯系原作者。如果來源標注有誤或侵犯了您的合法權益或者其他問題不想在本站發布,來信即刪。