我们将举办一系列古文NLP评测。以发布的语料为基准进行评测,推动古籍智能处理技术的发展。这些评测包括古籍OCR(文字识别)、自动句读、标点、分词、自动标引、专名识别、关系提取等。古文的评测尚处于初创期,将有广阔发展空间。我们预计每年将联合高校和企业举办一次评测,欢迎古籍相关专业师生、技术专家和爱好者关注、参赛!
今年正在进行的一项测评是第一届古汉语分词和词性标注国际评测EvaHan。主要通过对数据集的训练,对古籍文本进行分词、词性标注,检测分词和词性标注的正确率。详细内容请查看原文。
将信息技术的前沿领域——人工智能与大数据技术与蕴藏数千年东方智慧的中国古典文献结合在一起,是一个有着深厚潜力和重大文化价值的的交叉学科领域。经过二十余年的古籍数字化建设,图书馆界、商业公司以及民间藏家已经生产发布了数量可观的数字化典籍资源……
了解详情我们将举办一系列古文NLP评测。以发布的语料为基准进行评测,推动古籍智能处理技术的发展。这些评测包括古籍OCR(文字识别)、自动句读、标点、分词、自动标引、专名识别、关系提取等。古文的评测尚处于初创期,将有广阔发展空间。我们预计每年将联合高校和企业举办一次评测,欢迎古籍相关专业师生、技术专家和爱好者关注、参赛!
今年正在进行的一项测评是第一届古汉语分词和词性标注国际评测EvaHan。主要通过对数据集的训练,对古籍文本进行分词、词性标注,检测分词和词性标注的正确率。详细内容请查看原文。