欢迎访问南京市司法局网站

南京市司法局

当前位置:首页 > 工作动态

全国首例公证行业大模型训练数据集标注落地
责任编辑:  文章来源:南京市司法局  发布时间:2025-04-11 18:16  阅读次数:显示稿件总访问量

4月8日至10日,在省、市公证协会组织下,南京公证处、石城公证处、钟山公证处、江苏国际数据港和南京学府翻译有限公司共同开展了全国首例公证行业大模型训练数据集标注活动。全省近30名资深高级公证员齐聚一堂,聚焦公证行业大模型的业务逻辑、法律术语等关键维度开展封闭式数据标注作业,为模型精准理解公证场景筑牢坚实的数据根基。

去年9月13日,市局组织三家直属公证机构与江苏国际数据港签署战略合作协议,正式发布全国首个公证大模型产品。底座采用DeepSeek和Qwen等多模态架构,构建行业级智能体矩阵。目前,模型训练数据的收集、清洗、初期标注工作已先期完成,AI模型底座已成功搭建,在石城公证处本地机房实现离线部署,顺利完成基础数据治理、主要数据导入等工作。本次活动针对公证业务中的各类特殊疑难问题展开细致标注,由人工对标注结果进行审核和修正,完成3000余条数据标注工作,累计前期标注数据超万条,覆盖绝大多数公证法律服务事项,为公证行业大模型训练提供高质量数据,进一步提升大模型在公证领域的专业性与精准度。

公证大模型将于4月30日正式上线,预期实现一期开发任务中的对外咨询和公证员业务解答等功能,显著提升公证行业的工作效率,协助公证人员办理疑难复杂的公证事项,进一步构建行业信息开放共享的数据生态,助推公证数字化发展不断迈向新高度。