追一是NLP技术的领导者和推动者,元宇宙对话交互技术基础设施提供者

我们始终站在自然语言处理(NLP)技术研发和实践的前沿,在大规模预训练模型、自然语言智能交互(NL2X)、NLG(自然语言生成)等领域屡有创新,并将我们的技术成果开放给业界,持续推动NLP技术的发展。在未来元宇宙时代,NLP技术有着极大的应用潜力,我们致力于成为元宇宙对话交互技术基础设施提供者。

我们的优势

  • 大规模预训练模型技术
    深耕预训练模型技术,开源多个预训练模型并在业界得到广泛应用。拥有行业领先的针对特定业务场景的闭源预训练模型。
  • 文本生成技术
    拥有可控文本生成技术,可自由切换文本内容情感与传达的核心信息,可用于降低模型训练数据量并提供个性化机器人回复。
  • NL2X技术
    NL2X技术支持结构化与非结构化知识库的问答,追一在机器阅读理解与NL2SQL技术上拥有深厚积累,举办了国内首个中文NL2SQL比赛,并在机器阅读理解比赛中多次登顶榜首。
  • 文本分析技术
    利用信息抽取、对话结构解析、单句文本分析等多维度文本分析工具,为对话内容提供全方位的分析结果。

技术里程碑

2021.10

追一科技通过美国软件工程学会CMMI3认证

2021.09

获得中金资本旗下基础设施基金战略投资。

2021.06

中国互联网投资基金、国投创新战略投资追一科技。

2021.05

入选 IDC“欧洲、中国及亚太值得关注的新兴金融科技公司”

2021.03

入选 Forrester《亚太地区金融服务自然语言处理应用案例》报告。 获得《零售银行》中国零售金融创新实践“语音应用技术创新奖”。

2021.01

连续两年入选毕马威“中国领先金融科技企业 50 强”和德勤“高科技高成长 50 强”

2020.09

与广发银行合作的智能催收机器人项目,荣获《亚洲银行家》零售金融单元“中国最佳生产力、效率和自动化”年度大奖 CAIL 2020 司法人工智能挑战赛“司法摘要”冠军。

2020.08

入选 IDC 中国 Fintech 50 榜单

2020.06

在中国中文信息学会和中国计算机学会主办的语言与智能技术竞赛中获“关系抽取”冠军

2020.05

数字工场服务上线,提供机器人DIY和托管服务,即开即用,快速上线;CEO吴悦入选《财富》“2020年中国40位40岁以下商界精英”榜单

2020.04

入选Gartner自然语言处理领域Cool Vendor,是此次唯一入选的中国AI公司;成为腾讯5G生态计划首批创新伙伴;入选华为云鲲鹏凌云伙伴,智能在线机器人Bot与华为云鲲鹏云服务完成兼容性认证

2020.03

入选CB Insights全球人工智能创业100强,是入选销售&客户关系管理领域的唯一中国公司;入选华为云AI伙伴;与中软国际达成MSP意向,开启多个银行项目交付合作

2020.02

正式对外开放MSP生态合作模式

2020.01

在国际最新NLP权威榜单SuperGLUE上超越Facebook,跃居全球第二,工业模型第一

2019年

拓展至航空、人力BPO、地产等行业,数字员工数目3万,累计释放人力成本30亿元+,成立4年来,年均复合增长率近200%

2019.10

向专利局递交第100份专利申请;AML反洗钱平台上线;数字人第一个应用产品:虚拟新闻主播上线

2019.09

获得国际知名比赛CoQA冠军,全球首次单模型超过人类水平

2019.04

C轮4100万美元融资,投资方为招商局资本、中移资本、创新工场、晨兴资本、高榕资本、GGV

2019.03

新加坡分公司成立

2019.02

客户画像师Feature上线

2019.01

南京和白俄罗斯分公司成立,语音技术首次上线商用

2018年

拓展至教育、汽车、零售等行业 服务超过300家大型企业,中国千亿级企业中超过10%是我们的客户

2018.12

启动数字人技术研发

2018.10

智能培训师Learn上线

2018.09

语音机器人Call上线

2018.08

获得中文机器阅读理解比赛CMRC总冠军

2018.07

AI数字员工智能平台上线

2018.06

智能助理员Pal上线

2018.03

智能分析师See上线

2017年

进军银行、保险、证券、能源、运营商、互联网、出行等行业

2017.08

启动语音技术研发;B轮2060万美元融资,投资方为创新工场、GGV、晨兴资本、高榕资本

2017.05

上海分公司成立

2016.11

北京分公司成立

2016.09

A轮融资,投资方为高榕资本、晨兴资本

2016.06

落地第一个客户:滴滴

2016.05

向专利局递交第1份专利申请,业界首个将深度学习作为核心技术的在线机器人Bot上线

2016.03

追一科技成立

2016.01

天使轮融资,投资方为晨兴资本

NLP技术的开源

开源框架
bert4keras
基于keras的深度学习模型框架
开源模型
  • RoFormer
    RoFormer模型是追一科技提出的基于旋转位置编码的Transformer结构模型,这种新的位置编码形式具有良好的数学性质与实际效果。追一科技开源了base版本的RoFormer模型,并在许多下游任务上去的了优于BERT等常规开源模型的效果。
  • SimBERT
    SimBERT是追一科技基于UniLM思想,融检索与生成于一体的Transformer结构的预训练模型。SimBERT同时具备语义检索与同义语生成两种功能,因此该模型在问答、检索等领域都可以广泛应用。
  • GlobalPointer(全局指针)
    GlobalPointer利用全局归一化的思路来进行序列标注任务的预测,该方法通用于嵌套和非嵌套实体,并具有比CRF更高的计算效率,同时也可用于MRC等任务。
  • 中文T5 PEGASUS
    中文T5预训练模型在中文文本生产、特别是文本摘要任务上有很好的效果,适合微调作为文本摘要任务的基础模型使用。预训练任务以mT5为基础框架和初始权重,通过类PEGASUS的方式进行预训练。
  • NL2SQL
    2019年追一举办了首届NL2SQL挑战赛,并为比赛提供了中文领域的第一份NL2SQL数据集。
  • WoBERT
    追一科技在原本的bert分词方式基础上,针对中文特点加入了词级别的token,使得同样的中文句子,模型的编码长度缩短,提升训练速度;在文本生成任务上,能缓解Exposure Bias问题;词义的不确定性更低,降低建模复杂度。

追一学术论文库

追一致力于最前沿的自然语言处理技术的研究,在一系列国际顶级会议和期刊上发表了数十篇论文。我们希望能通过这些论文的交流,与学术界共同推进自然语言处理技术的进步。