chatgpt 抓取網站數據 【第五屆RPA極客挑戰賽】賽題三:打造可以聯網的ChatGPT搜索助手
【第五屆RPA極客挑戰賽】結束后很多未參與的伙伴留言對賽題設置很感興趣,賽題結合當前爆火的、大語言模型技術熱點,共設置、、“打造可以聯網的搜索助手”三道題目。我們將在公眾號以文章形式發布詳細的賽題說明,供大家參閱。
賽題3:打造可以聯網的搜索助手(45分)
一、賽題背景
在當今信息爆炸的時代,大量的知識和數據被廣泛分布在互聯網上。對于大語言模型(如GPT)這樣的強大工具,賦予其可以上網搜索數據的能力將極大地提升其實用性和智能化程度。這種能力的結合可以為用戶提供更加全面準確的信息,并且有效地應用于各種場景,如數據分析、自動化任務等。因此,本屆RPA黑客松挑戰賽設置了這樣一個賽題,旨在為GPT結合RPA抓取功能,使其具備上網搜索數據的能力。
現實意義:
提升信息獲取效率:GPT結合RPA抓取功能可以自動化地從互聯網上獲取信息,無需人工手動搜索,大大提高了信息獲取的效率。
增強數據分析能力:通過上網搜索數據,GPT可以獲取更全面準確的信息來進行數據分析,從而提供更有價值的洞察和決策支持。
自動化任務執行:結合RPA抓取功能,GPT可以自動化執行特定任務,并根據搜索結果進行進一步處理,從而減輕人工工作負擔。
個性化服務提供:基于上網搜索數據的能力,GPT可以根據用戶需求提供個性化的服務,如搜索新聞、查看天氣或預定機票和酒店等。
二、賽題流程描述
1.(RPA)讀取輸入名為 的表格chatgpt 抓取網站數據,遍歷表格內的所有問題();
2.(RPA)RPA打開瀏覽器通過搜索引擎搜索關鍵字并獲得結果的索引list;
3.(RPA)遍歷索引list,并獲取對應索引中的頁面的正文文本數據(一般為p標簽內的文本),并保存、url以及網頁文本數據,到第一步中的文件中,新建名稱與問題名字保持一致;
4.將文本數據發送給chatgpt 抓取網站數據,通過構建合適的提示詞,詢問是否包含該問題()的答案,如果包含,則進行下一個問題,如果不包含,則遍歷下一個返回的索引頁面;
5.(RPA)把問題答案保存到步驟1中的文件中的列中。
6(手動)上傳文件和錄屏文件到競賽系統
三、賽題幫助和文件要求說明
1.獲取頁面有用的內容chatgpt 抓取網站數據,可以嘗試在body標簽下的所有的
標簽中獲取(一般情況下)
2.構建合適的提示詞,通過給到內容來咨詢是否包含答案,注意要對答案進行判斷是否包含,讓RPA機器人可以有一個確切的循環判斷條件。
四、分數說明
本賽題共計45分
五、賽題數據包下載
在公眾號后臺回復“數據包3”,可下載本道賽題的數據包。
報告下載
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表本站的觀點和立場和對其真實性負責。如需轉載,請聯系原作者。如果來源標注有誤或侵犯了您的合法權益或者其他問題不想在本站發布,來信即刪。
聲明:本站所有文章資源內容,如無特殊說明或標注,均為采集網絡資源。如若本站內容侵犯了原著者的合法權益,可聯系本站刪除。