数据集动效装饰
数据集动效装饰

多领域高质量数据集

丰富的标准化数据集体系

我们提供多领域、高质量的结构化数据集,覆盖金融、采购公告、医疗影像、OCR识别等核心场景,满足不同业务的数据需求。

金融财报数据集

核心定义

整合A股/港股/美股等上市企业多维度财务数据,经标准化清洗、校验、结构化处理后形成的专业数据集,覆盖企业全生命周期财务指标。

核心内容

  • 企业基础信息(股票代码、所属行业、上市地点)
  • 三大财务报表核心指标(资产负债、利润、现金流量)
  • 衍生分析指标(ROE、毛利率、资产负债率等)

应用场景

投资决策分析、企业信贷风险评估、金融量化策略开发、行业财务趋势研究。

OCR手写数据

核心定义

针对手写文字识别场景构建的标注数据集,包含各类手写文档原始图片与精准结构化文本标注结果,适配不同书写风格与场景。

核心内容

  • 票据类(手写发票、报销单、提单)
  • 文档类(手写笔记、合同、考试答卷)
  • 场景类(手写快递单、身份证、门店招牌)

应用场景

财务票据自动化识别、教育答卷智能批改、政务文档数字化、物流信息自动录入。

K12试卷数据集

核心定义

覆盖小学至高中全学科、全年级的标准化试卷数据集,包含试卷原文、题目标注、答案解析、知识点标签等结构化信息。

核心内容

  • 试卷原文(高清扫描件、结构化文本)
  • 题目标注(题型、难度、分值、考点)
  • 答案解析(标准答案、解题思路、易错点)

应用场景

智能作业批改系统、AI教育辅导机器人、个性化学习推荐、题库智能生成。

医疗影像图片数据集

核心定义

经医疗机构授权、脱敏处理的专业医疗影像数据集,包含各类影像原始数据与医学标注信息,符合医疗数据合规要求。

核心内容

  • 常规影像(X光、CT、MRI、超声图像)
  • 标注信息(病灶位置、大小、类型、分级)
  • 临床信息(患者基本信息、诊断结论、治疗方案)

应用场景

医学影像AI辅助诊断、疾病筛查系统开发、医疗教学培训、新药研发数据分析。

法律文书数据集

核心定义

涵盖各类司法文书的结构化数据集,经专业法律人员标注、分类、解析,包含文书全文、关键信息提取、法律条款关联等内容。

核心内容

  • 文书类型(判决书、裁定书、起诉状、调解书)
  • 关键信息(案由、当事人、判决结果、法律依据)
  • 条款关联(关联法律法规、司法解释、案例)

应用场景

智能法律咨询系统、法律文书自动生成、案件趋势分析、司法大数据研究。

台湾书籍古籍数据集

核心定义

收录台湾地区珍贵古籍、地方志、文献典籍的数字化数据集,经高清扫描、OCR识别、文字校勘后形成结构化文本。

核心内容

  • 古籍类型(地方志、文史典籍、民间文献、族谱)
  • 文本信息(原文、标点标注、简体转换、注释)
  • 元数据(成书年代、作者、版本、馆藏信息)

应用场景

古籍数字化保护、历史文化研究、智能古籍检索、两岸文化交流数据分析。

商品条码数据集

核心定义

覆盖全品类商品的条码标准化数据集,包含条码编码、商品信息、品牌分类等结构化数据,适配零售、物流等场景应用。

核心内容

  • 条码信息(EAN-13、UPC、二维码等编码)
  • 商品属性(名称、规格、品牌、产地、价格)
  • 分类信息(行业分类、品类层级、适用场景)

应用场景

零售收银系统、物流仓储管理、商品溯源、电商商品信息自动录入。

学术期刊数据集

核心定义

整合国内外核心学术期刊论文的结构化数据集,包含论文全文、元数据、关键词、引文关系等专业信息,覆盖多学科领域。

核心内容

  • 论文元数据(标题、作者、单位、发表时间、期刊等级)
  • 内容信息(摘要、关键词、正文、参考文献)
  • 学术指标(被引量、下载量、被收录情况)

应用场景

学术文献检索系统、科研趋势分析、智能论文写作辅助、高校学科建设评估。

有任何需求或问题,欢迎填写表单,我们会尽快回复您!

提交成功!我们会尽快与您联系
请输入您的姓名
请输入正确的手机号
请输入咨询内容
Top
Preloader