约100,000首歌词数据
¥99.00
BoolQ是一个包含15942个示例的是/否问题的问题回答数据集。
免费
NBA球员数据分析
免费
NLP机器翻译数据集,中文-->俄文
免费
MIcrosoft 新闻数据集(MIND)是用于新闻推荐研究的大规模数据集
免费
这个匿名数据集是从 Tagged.com 社交网络网站收集。
免费
DocRED 是一个比较新的大规模的众包数据集。其原始语料主要基于维基百科,包含了 3053 份文章,其中大约存在 7% 的实体,**DocRED** 还提供了公开的 leaderboard,用户可将模型预测的结果上传,评估文档级关系抽取的各种性能。160MB 2019
免费
该数据集是代码注释自动生成任务的相关数据集,含有448512条Java程序片段以及相应的注释。
免费
英语-西班牙语翻译语料库,该数据集共含有118964对(english,spanish)语句对,可用于神经机器翻译任务。
免费
包括train、dev、test、infer,其中train分为pointwise和pairwise两种训练模式。 包含4份自建测试集,分别为zhidao、unicom、ecom、qqsim
免费
该数据集用于汽车大师问答摘要与推理常规赛;该数据集内含训练集和测试集两个文件. 文件均为CSV格式. 验证集稍后会补充.
免费
从 Wikipedia 文章中提取出的问题和答案对,从 500 多篇文章中摘取出的 10 万多个问题和答案。
免费
美国知识问答网站 Quora 上的问题答案数据集,可用以进行重复问题检测。
免费
Large Movie Review Dataset
免费
斯坦福问答数据
免费
由斯坦福大学标注的语义词汇数据,人工标注了9645个英语句子的语义树结构。
免费
1亿个词汇的英文词库数据,从Wikipedia的优质文章和标杆文章中提取得到,包括WikiText-2和WikiText-103两个版本
免费
跨语言实体名称语料库
免费
Structured Web Data Extraction 数据集
免费
英文新闻数据集,包含 20个 类别共 20000篇 新闻文档,可用以进行文档分类和自然语言处理等任务。
免费
包括从244个网站上利用Chrome的BS Detector扩展工具识别出的假新闻数据。
免费
约100,000首歌词数据
¥99.00
BoolQ是一个包含15942个示例的是/否问题的问题回答数据集。
免费
NBA球员数据分析
免费
NLP机器翻译数据集,中文-->俄文
免费
MIcrosoft 新闻数据集(MIND)是用于新闻推荐研究的大规模数据集
免费
这个匿名数据集是从 Tagged.com 社交网络网站收集。
免费
DocRED 是一个比较新的大规模的众包数据集。其原始语料主要基于维基百科,包含了 3053 份文章,其中大约存在 7% 的实体,**DocRED** 还提供了公开的 leaderboard,用户可将模型预测的结果上传,评估文档级关系抽取的各种性能。160MB 2019
免费
该数据集是代码注释自动生成任务的相关数据集,含有448512条Java程序片段以及相应的注释。
免费
英语-西班牙语翻译语料库,该数据集共含有118964对(english,spanish)语句对,可用于神经机器翻译任务。
免费
包括train、dev、test、infer,其中train分为pointwise和pairwise两种训练模式。 包含4份自建测试集,分别为zhidao、unicom、ecom、qqsim
免费
该数据集用于汽车大师问答摘要与推理常规赛;该数据集内含训练集和测试集两个文件. 文件均为CSV格式. 验证集稍后会补充.
免费
从 Wikipedia 文章中提取出的问题和答案对,从 500 多篇文章中摘取出的 10 万多个问题和答案。
免费
美国知识问答网站 Quora 上的问题答案数据集,可用以进行重复问题检测。
免费
Large Movie Review Dataset
免费
斯坦福问答数据
免费
由斯坦福大学标注的语义词汇数据,人工标注了9645个英语句子的语义树结构。
免费
1亿个词汇的英文词库数据,从Wikipedia的优质文章和标杆文章中提取得到,包括WikiText-2和WikiText-103两个版本
免费
跨语言实体名称语料库
免费
Structured Web Data Extraction 数据集
免费
英文新闻数据集,包含 20个 类别共 20000篇 新闻文档,可用以进行文档分类和自然语言处理等任务。
免费
包括从244个网站上利用Chrome的BS Detector扩展工具识别出的假新闻数据。
免费