chatgpt 抓取網(wǎng)站數(shù)據(jù) Excel竟然還有這種騷操作!自動(dòng)同步網(wǎng)站數(shù)據(jù)
新酷產(chǎn)品第一時(shí)間免費(fèi)試玩,還有眾多優(yōu)質(zhì)達(dá)人分享獨(dú)到生活經(jīng)驗(yàn),快來新浪眾測,體驗(yàn)各領(lǐng)域最前沿、最有趣、最好玩的產(chǎn)品吧~!下載客戶端還能獲得專享福利哦!
本文來自太平洋電腦網(wǎng)
有時(shí)我們需要從網(wǎng)站獲取一些數(shù)據(jù)chatgpt 抓取網(wǎng)站數(shù)據(jù),傳統(tǒng)方法是通過復(fù)制粘貼,直接粘到里。不過由于網(wǎng)頁結(jié)構(gòu)不同,并非所有的復(fù)制都能有效。有時(shí)即便成功了,得到的也是“死數(shù)據(jù)”,一旦后期有更新,就要不斷重復(fù)上述操作。能否制作一個(gè)隨網(wǎng)站自動(dòng)同步的表呢?答案是肯定的,這就是里的 功能。
1。 打開網(wǎng)頁
下圖這個(gè)網(wǎng)頁chatgpt 抓取網(wǎng)站數(shù)據(jù),是中國地震臺網(wǎng)的官方頁面()。每當(dāng)有地震發(fā)生時(shí),就會自動(dòng)更新到這里。既然我們要抓取它,就要首先打開這個(gè)網(wǎng)頁。
首先打開要抓取的網(wǎng)頁
2。 確定抓取范圍
打開,點(diǎn)擊“數(shù)據(jù)”→“獲取數(shù)據(jù)”→“自其他源”,將要抓取的網(wǎng)址粘貼進(jìn)來。此時(shí) 會自動(dòng)對網(wǎng)頁進(jìn)行分析,然后將分析結(jié)果顯示在選框內(nèi)。以本文為例, 共分析出兩組表格,點(diǎn)擊找到我們所需的那個(gè),然后再點(diǎn)擊“轉(zhuǎn)換數(shù)據(jù)”。片刻后,就會自動(dòng)完成導(dǎo)入。
建立查詢chatgpt 抓取網(wǎng)站數(shù)據(jù),確定抓取范圍
3。 數(shù)據(jù)清洗
導(dǎo)入完成后,就可以通過 進(jìn)行數(shù)據(jù)清洗了。所謂“清洗”說白了就是一個(gè)預(yù)篩選過程,我們可以在這里挑選自己所需的記錄,或者對不需要的列進(jìn)行刪除與排序操作。其中右鍵負(fù)責(zé)刪除數(shù)據(jù)列,面板中的“保留行”用來篩選自己所需的記錄。清洗完成后,點(diǎn)擊左上角的“關(guān)閉并上載”即可上傳。
數(shù)據(jù)“預(yù)清洗”
4。 格式調(diào)整
數(shù)據(jù)上傳后,可以繼續(xù)進(jìn)行格式化處理。這里的處理主要包括修改表樣式、文字大小、背景色、對齊、行高列寬,添加標(biāo)題等等,通俗點(diǎn)說就是一些美化操作,最終我們便得到了下圖這個(gè)表。
對表格進(jìn)行一些美化處理
5。 設(shè)置自動(dòng)同步間隔
目前表格基礎(chǔ)已經(jīng)完成,但和復(fù)制粘貼一樣,此時(shí)得到的仍然只是一堆“死數(shù)據(jù)”。想讓表格自動(dòng)更新,需要點(diǎn)擊“查詢工具”→“編輯”→“屬性”,并勾選其中的“刷新頻率”和“打開文件時(shí)刷新數(shù)據(jù)”。處理完成后,表格就可以自動(dòng)同步了。
設(shè)置內(nèi)容自動(dòng)同步
注:默認(rèn)情況下數(shù)據(jù)刷新會導(dǎo)致列寬變化,此時(shí)可以點(diǎn)擊”表格工具“→“外部表數(shù)據(jù)”→“屬性”,取消“調(diào)整列寬”前面的復(fù)選框解決這個(gè)問題。
防止更新時(shí)破壞表格式
寫在最后
這個(gè)技巧很實(shí)用,特別是在制作一些動(dòng)態(tài)報(bào)表時(shí),能夠大大減輕人工提取所產(chǎn)生的麻煩。好了,這就是本期要和大家分享的一個(gè)小技巧,是不是很有用呢!
免責(zé)聲明:本文系轉(zhuǎn)載,版權(quán)歸原作者所有;旨在傳遞信息,不代表本站的觀點(diǎn)和立場和對其真實(shí)性負(fù)責(zé)。如需轉(zhuǎn)載,請聯(lián)系原作者。如果來源標(biāo)注有誤或侵犯了您的合法權(quán)益或者其他問題不想在本站發(fā)布,來信即刪。
聲明:本站所有文章資源內(nèi)容,如無特殊說明或標(biāo)注,均為采集網(wǎng)絡(luò)資源。如若本站內(nèi)容侵犯了原著者的合法權(quán)益,可聯(lián)系本站刪除。