admin 发表于 2023-2-6 14:08

【分享】千万级百度知道语料

来自:https://spaces.ac.cn/archives/5067## 发布2018年01月30日## 数目共1千万条## 格式```[ { ‌‌‌‌‌‌‌ url : http://zhidao.baidu.com/question/565618371557484884.html , question : 学文员有哪些专科学校 , tags : [ 学校 , 专科 , 院校信息] }, { ‌‌‌‌‌‌‌ url : http://zhidao.baidu.com/question/2079794100345438428.html , question : 网赌和澳门赌有区别吗 , tags : [ 网络 , 澳门 , 赌博] }]```## 用途自己想## 来源自行持续多月的监控和爬取## 说明本次分享仅供学习研究使用,请勿用于任意商业 非法用途。对违规使用本语料所造成的不良后果,使用者自行负责。## 作者苏剑林(http://kexue.fm)## 下载```链接:https://pan.baidu.com/s/1ggUOrIV 密码:5nka压缩后300M+,解压后2G+````
页: [1]
查看完整版本: 【分享】千万级百度知道语料