欧美阿v视频在线大全_亚洲欧美中文日韩V在线观看_www性欧美日韩欧美91_亚洲欧美日韩久久精品

主頁 > 知識庫 > python 爬取騰訊視頻評論的實現步驟

python 爬取騰訊視頻評論的實現步驟

熱門標簽:申請辦個400電話號碼 400電話辦理費用收費 高德地圖標注字母 深圳網絡外呼系統代理商 騰訊地圖標注有什么版本 外呼系統前面有錄音播放嗎 千呼ai電話機器人免費 鎮江人工外呼系統供應商 柳州正規電銷機器人收費

一、網址分析

查閱了網上的大部分資料,大概都是通過抓包獲取。但是抓包有點麻煩,嘗試了F12,也可以獲取到評論。以電視劇《在一起》為例子。評論最底端有個查看更多評論猜測過去應該是 Ajax 的異步加載。
網上的大部分都是構建評論的網址,通過 requests 獲取,正則表達式進行數據處理。本文也利用該方法進行數據處理,其實利用 scrapy 會更簡單。
根據前輩給出的經驗,順利找到了評論所在的鏈接。

在新標簽中打開,該網址的鏈接。

評論都在"content":"xxxxx"里面,所有可以通過正則表達式獲取。
那么現在要開始構建網址,找到其規律。
在查找評論鏈接的過程中無意發現,點擊影評旁邊的評論總數,可以獲取到更為干凈的評論界面。結果是一樣的。

既然是要爬取所有的評論,所以知道評論數是必不可少的。

再通過F12獲取到評論鏈接,找到網址的規律,構建網址,加載三四個評論就行了。這里加載了四個網址。把所有網址復制到文本文件中,進行對比分析。

觀察發現只有 cursor 和 source 進行了改變,其他是不變的,二 source 是在第一個的基礎上進行加一操作,所以只需要獲取到 cursor 即可。我們打開一個評論鏈接的網址,我們可以知道,cursor 其實是上一頁 最后一個用戶的ID碼。所以我們只需要在爬取上一頁的時候一起爬蟲了。然后就可以構建網址。

二、代碼編寫

這個代碼還是簡單的。套用之前上課做的模板就可以直接進行爬蟲了。
通過正則表達式獲取評論,返回一個列表;
正則表達式獲得的 cursor 碼是列表,所以要轉化為字符串使用;
source 很簡單了,直接在上一個的基礎上加一即可。

def getComment(html): # 爬取單頁評論

 findeComment = re.compile(r'"content":"(.*?)"', re.S)
 comment = re.findall(findeComment, html)
 # print(comment)
 return comment

def getCursor(html): # 獲取下一頁的cursor碼
 findeCursor = re.compile(r'"last":"(.*?)"', re.S)
 cursor = re.findall(findeCursor, html)[0]
 # print(cursor)
 return cursor


def getSource(source): # 獲取下一頁的source碼
 source = int(source) + 1
 return str(source)

有點難度的可能就送弄代理吧,但是代理可以模仿網上其他人的寫法,所以還是不是很難。

#添加用戶代理

def ua(uapools):
 thisua = random.choice(uapools)
 # print(thisua)
 headers = ("User-Agent", thisua)
 opener = urllib.request.build_opener()
 opener.addheaders = [headers]
 # 設置為全局變量
 urllib.request.install_opener(opener)

三、遇到的問題

1. 獲取評論的時候也將子評論爬蟲進去了。

仔細查看了源碼,發現評論主要在 data 下面的 oriCommList 列表里,其他范圍的評論為子評論。個人認為子評論也算有效評論,目前不打算處理。

2. 獲取全部評論數,直接通過 requests 獲取不到

嘗試了 xpath 和 requests 發現不能獲取全部評論數,所以目前只能通過 selenium 獲取,但是 selenium 效率太低了,就獲取一個評論總數,還不如打開源碼直接修改評論總數,所以暫時沒有修改

3. 評論總數數據太大

因為之前爬蟲過很多網站,同一個 user-agent 很容易被 ban ,所以目前構建了用戶代理,然后進行隨機。其實還想加一個 ip 代理的,但是使用了 ip 代理的網址,上面寫的正常的 ip ,在使用的時候,拒絕連接。也嘗試過構建代理池。但是代理池一般都是使用docker 和 Redis 進行獲取。暫時沒有選用,之選用了用戶代理,然后在獲取 headers 的時候加個 time.sleep(1)。目前還是正常的。

4. 報錯'utf-8' codec can't decode byte 0xff in position 1: invalid start byte

遇到這個問題,實在無語,我懷疑后面的評論是新出的 emjoy,然后utf-8不能識別,程序掛掉了。但是選取其他格式,在解釋的過程估計還會掛掉,就暫時爬到1萬條吧。

四、完整代碼

代碼倉庫

以上就是python 爬取騰訊視頻評論的實現步驟的詳細內容,更多關于python 爬取騰訊視頻評論的資料請關注腳本之家其它相關文章!

您可能感興趣的文章:
  • Python爬取騰訊視頻評論的思路詳解
  • 使用python實現抓取騰訊視頻所有電影的爬蟲
  • 基于python實現的抓取騰訊視頻所有電影的爬蟲
  • Python爬蟲小練習之爬取并分析騰訊視頻m3u8格式

標簽:烏蘭察布 平頂山 海南 哈爾濱 烏蘭察布 合肥 大慶 郴州

巨人網絡通訊聲明:本文標題《python 爬取騰訊視頻評論的實現步驟》,本文關鍵詞  python,爬取,騰訊,視頻,評論,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《python 爬取騰訊視頻評論的實現步驟》相關的同類信息!
  • 本頁收集關于python 爬取騰訊視頻評論的實現步驟的相關信息資訊供網民參考!
  • 推薦文章
    欧美阿v视频在线大全_亚洲欧美中文日韩V在线观看_www性欧美日韩欧美91_亚洲欧美日韩久久精品
  • <rt id="w000q"><acronym id="w000q"></acronym></rt>
  • <abbr id="w000q"></abbr>
    <rt id="w000q"></rt>
    日韩成人午夜电影| 久久精品国产亚洲av麻豆| 蜜桃传媒一区二区亚洲| 911精品产国品一二三产区 | 亚洲 欧美 日韩在线| 在线观看日韩电影| 亚洲男人的天堂av| 99久久er热在这里只有精品15| 内射一区二区三区| 国产精品久久久久永久免费观看| 国产精品1024| 91香蕉视频在线播放| 中文字幕欧美一| 成人av在线网| 一本一道综合狠狠老| 亚洲精品免费一二三区| 日本少妇一区二区三区| 欧美午夜精品久久久久久孕妇| 一区二区三区四区激情| 国产乱国产乱老熟300部视频| 欧美美女网站色| 三级一区在线视频先锋 | 国产精品嫩草影院av蜜臀| 国产精品91xxx| 91久久久久久久久久久久久久| 国产精品久久久久久久久免费丝袜| 成人深夜在线观看| 色噜噜狠狠一区二区三区果冻| 亚洲人妖av一区二区| 国产精品19p| 日韩视频一区在线观看| 精品在线免费观看| 国产老头老太做爰视频| 亚洲精品国产精品乱码不99| 国产高潮失禁喷水爽到抽搐| 51精品秘密在线观看| 美腿丝袜亚洲三区| 国产黄色录像片| 亚洲精品成人少妇| 黄色网址在线视频| 久久嫩草精品久久久精品一| 成人性生交大合| 欧美在线免费视屏| 日本亚洲视频在线| 毛片视频免费播放| 亚洲精品五月天| 黄色a一级视频| 欧美国产日韩精品免费观看| 99re6这里只有精品视频在线观看| 欧美精品tushy高清| 久久超碰97人人做人人爱| 国产盗摄一区二区三区在线| 亚洲国产精品人人做人人爽| 男女做爰猛烈刺激| 亚洲天天做日日做天天谢日日欢| 国产一级黄色录像| 国产香蕉久久精品综合网| 老女人性生活视频| 久久综合九色综合欧美就去吻| 成人午夜私人影院| 日韩一区二区三区免费观看| 国产福利不卡视频| 欧美精品aⅴ在线视频| 国产精品综合网| 欧美日本一道本在线视频| 国产一区二区在线影院| 欧美性感一类影片在线播放| 久久精品国产一区二区| 欧美亚洲一区三区| 精品一区二区在线播放| 欧美自拍偷拍一区| 极品销魂美女一区二区三区| 欧美在线一区二区三区| 精品一区二区三区日韩| 欧美日本一道本| 粉嫩久久99精品久久久久久夜| 91麻豆精品国产91久久久久| 国产成人av网站| 日韩精品一区二区三区三区免费 | 亚洲精品日韩专区silk| a级在线免费观看| 亚洲一区二区三区精品在线| 国产一区二区精彩视频| 久久精品国产精品青草| 欧美久久一区二区| 成人sese在线| 久久久久高清精品| 亚洲天堂美女视频| 亚洲精品视频自拍| 国产人与禽zoz0性伦| 日韩高清不卡一区二区| 欧美在线观看视频在线| 国产成人福利片| 精品国产人成亚洲区| 亚洲成年人在线观看| 亚洲欧洲国产日本综合| 波多野结衣家庭教师在线观看| 日本欧美一区二区在线观看| 欧美日韩一区二区在线观看 | 第一页在线视频| 国产精品久久久久久久蜜臀| 中文字幕av久久爽一区| 丝袜诱惑制服诱惑色一区在线观看 | 欧美三级一区二区| av一区二区不卡| 中文久久乱码一区二区| 日韩毛片无码永久免费看| 水野朝阳av一区二区三区| 欧美视频你懂的| 99国产精品久久久久久久久久| 国产精品久久综合| 国内毛片毛片毛片毛片毛片| 精品亚洲免费视频| 欧美成人女星排名| 三级电影在线看| 水野朝阳av一区二区三区| 欧美久久久久久久久| 亚洲综合中文网| 亚洲另类春色校园小说| 色系网站成人免费| 成人久久久精品乱码一区二区三区 | 亚洲bt欧美bt精品| 欧美色图12p| 中国特级黄色片| 亚洲一区二区三区小说| 欧美最猛黑人xxxxx猛交| gogogo免费视频观看亚洲一| 国产精品伦一区| 免费看一级大片| 国产91精品一区二区麻豆网站| 久久精品视频免费| 免费看一级黄色| 国产河南妇女毛片精品久久久| 国产三级精品视频| 五月综合色婷婷| 成人永久免费视频| 亚洲欧美综合另类在线卡通| 久久久久久久久毛片| 99精品国产99久久久久久白柏| 一区二区在线观看免费视频播放| 在线观看一区二区视频| 久久久久亚洲av无码网站| 亚洲一区二区美女| 欧美一区二区三区精品| 国产男男chinese网站| 寂寞少妇一区二区三区| 国产精品天美传媒| 色婷婷综合视频在线观看| 特种兵之深入敌后| 日韩国产一二三区| 欧美精品一区二| 亚洲伦理一区二区三区| 91一区二区三区在线观看| 亚洲高清在线精品| 精品sm在线观看| 在线观看亚洲网站| 国产伦精品一区二区三区妓女下载| 亚洲国产欧美另类丝袜| 日韩精品一区二| 成人18视频免费69| 先锋资源在线视频| 免费人成在线不卡| 亚洲国产精品二十页| 在线观看免费亚洲| 男男做爰猛烈叫床爽爽小说| 国产一区二区影院| 亚洲免费电影在线| 欧美一区二区三区婷婷月色| 天堂在线中文视频| 91在线精品一区二区三区| 日日噜噜夜夜狠狠视频欧美人| 久久久99精品免费观看| 在线免费精品视频| 少妇精品一区二区三区| 高清shemale亚洲人妖| 一区二区三区四区五区视频在线观看| 欧美一区二区三区婷婷月色| 国精产品视频一二二区| 中文字幕avav| 国产最新精品精品你懂的| 亚洲裸体在线观看| 精品剧情v国产在线观看在线| 免费三级在线观看| 亚洲精品乱码久久久久久久| 国产v日产∨综合v精品视频| 亚洲国产精品综合小说图片区| 亚洲精品一区二区三区香蕉| 色8久久精品久久久久久蜜| 国产三级视频网站| 成人手机电影网| 免费看欧美女人艹b| 成人免费在线视频| 精品日韩在线一区| 色美美综合视频| 久久婷婷五月综合| 日韩成人av影院| 国产91丝袜在线播放0| 日韩国产高清在线| 亚洲欧美激情一区二区| 久久午夜电影网|