百度、阿里之后，京东大模型“ChatJD”也要来了

来源：第一财经 2023-04-09 06:24:33

4月8日，在人工智能大模型技术高峰论坛上，京东集团副总裁何晓冬表示，京东将在今年发布新一代大模型“ChatJD”，定位为产业版本ChatGPT。

两个月前，京东云曾公布过ChatJD的落地应用路线图“125”计划：一个平台、两个领域和五个应用。一个平台为ChatJD智能人机对话平台，即自然语言处理中理解和生成任务的对话平台，两个领域为零售和金融。五个应用包括内容生成、人机对话、用户意图理解、信息抽取和情感分类。

结合京东自身实践，京东大模型主要聚焦于文本、语音、对话和数字人生成等4个方面开展工作。例如在文本生成方面，京东于2019年开始自研，基于自研领域模型K-PLUG(参数量10亿)，对于给定商品的sku自动生成长度不等的商品文案，包括商品标题(10个字)、商品卖点文案(100字)和商品直播文案(500字)三类，目前商品文案写作能力已覆盖2000多个京东的品类。

(资料图片仅供参考)

作为京东AI技术的带头人，何晓冬认为ChatGPT最大的创新在于文本内容生成。ChatGPT通过交互式对话来逐步理清用户的意图，尤其针对一些比较复杂的意图，ChatGPT能够通过几轮的人机交互让用户讲清楚诉求，ChatGPT也能完全理解用户意图并给出相应回答。再配合ChatGPT文本生成的高完整度，体验就到达了一个阈值，到了一个“令人惊艳”的水平。

从技术角度看，相较于之前大量使用的无监督深度学习算法，ChatGPT模型背后的算法和训练过程更加新颖，使用了半监督学习算法，尤其ChatGPT把生成的文本模型更加“组织化”，是非常大的技术创新。如果没有数据甄选，模型参数即便大十几倍，也很难达到这个效果。某种意义上，这其实是对过去一味追求(参数)“大”和追求无监督学习的一个路线修正。相较于GPT-3.5及ChatGPT主要处理文本数据，GPT-4是一个大型的多模态模型，提高了大模型的多模态处理能力。GPT-4可以支持图像和文本输入，并生成文本回复。在多种专业和学术考试方面达到人类水平，其逻辑分析能力更加全面，回答更有条理，理解更加准确，并拥有了识图能力。

记者了解到，在团队建设方面，当前京东AI研发团队主要成员为何晓冬、吴友政、张政臣和陈蒙。何晓冬于2018年加入京东，打造了言犀人工智能应用平台和系列产业和解决方案。公开资料显示，“言犀”目前服务覆盖5.8亿用户、880家金融机构、1821家大型企业、195万多家中小微企业。

吴友政目前为京东集团高级总监和京东科技语音语言算法部负责人。自2006年中科院博士毕业后，先后在日本国立信息通信研究机构、英国爱丁堡大学等机构从事自然语言处理相关研究工作。工作主要聚焦自然语言处理、人机对话、语音识别、机器翻译等技术研究和产品研发工作，他与团队合作打造了言犀人工智能应用平台。

张政臣现为京东语音合成产品负责人，先后工作于新加坡科技研究发展局和京东。2018年7月加入京东以来，他作为主要参与者参与了京东语音合成产品研发和销售的过程。其产品已经在言犀智能客服，京东金融、京东直播、京东智能音箱等内外部客户大规模应用。

陈蒙现为京东科技人机交互技术部负责人。2018年5月加入京东，现任京东科技人机交互技术部负责人。加入京东后，先后打造京东科技两大旗舰型产品-京小智和言犀的核心算法引擎，所研发的人机对话产品服务于京东的商家和用户。

除了京东外，多家互联网公司也发布了相关大模型产品。百度在3月16日发布了新一代大语言模型、生成式AI产品文心一言。3月30日，腾讯集团高级执行副总裁汤道生表示腾讯正在研发类ChatGPT聊天机器人。4月7日，阿里云宣布，自研大模型“通义千问”开始邀请用户测试体验。

第一财经作者：陆涵之