今年会jinnianhui官网-为什么大厂必须抢郭达雅？

2026-04-24 14:47:22

首页财产ai正文为何年夜厂必需抢郭达雅？郭达雅1995年出生在广东珠海，2014年考入中山年夜学数据科学与计较机学院。年夜四时入选中山年夜学与微软亚洲研究院结合造就博士生项目，于印鉴传授及周明博士引导下攻读博士学位，研究标的目的是天然语言处置惩罚。 2026-03-23 13:20 ·微信公家号：字母榜作者苗正，编纂王靖 AI投资人解读· 郭达雅学术结果显著，发表论文援用超37000次，h指数37，i-10指数46，其研究鞭策了CodeBERT和Vibe Coding成长，还有介入DeepSeekMath研发。 · 行业竞争激烈，人材流动频仍，其去职或者影响DeepSeek-V4发布进程；新东家整合也需时间磨合。总结：郭达雅依附凸起学术孝敬及技能能力，对于相干范畴意义庞大。其去职为新东家带来机缘，也给DeepSeek带来挑战，后续成长值患上存眷。内容由AI天生，仅供参考

有如许一则动静于AI圈悄然传播：DeepSeek研究员郭达雅已经经去职。

各人*时间的反映遍及是“谁？谁是郭达雅？”

这不难理解，由于郭达雅的知名度远不如开创人梁文锋以和“天才AI奼女”罗福莉。

可是于学术研究以和对于DeepSeek年夜模子的孝敬上，郭达雅要比后二者高很多。

截止至发稿，郭达雅发表的论文已经经被援用跨越37000次，远远跨越了同龄的研究者。

郭达雅的h指数为37，i-10指数为46，申明他不仅学术产出很是不变，并且他还有发表了多篇拥有极高影响力的论文。

甚至可以这么说，只要你相识过郭达雅的研究标的目的以和他所主导的研究后，你就会熟悉到，昔时之以是能呈现DeepSeek时刻，郭达雅*功不成没。

那他去哪了？今朝有两种说法，一种说是baidu，一种说是字节。

现实上这两年插手字节的这几个年夜牛，周畅、郁博文、蒋路，他们都是视频标的目的的。

郭达雅纷歧样，他是代码智能及数学标的目的的，他恰好可以补强字节于Vibe Coding以和AGI这两年夜板块。

假如是去baidu，那也说患上通。文心快码于3月份方才完成为了4.0版本迭代，推出了多agent协同全链路开发的功效。

可是你知道文心快码3.0是何时发布的吗？是2024年11月。两个年夜版本中间相隔了一年多，这于以周为单元的AI圈是不太常见的。

这么看下来，baidu实在比字节更需要郭达雅。

然而对于在迟迟不发布V4的DeepSeek，郭达雅的去职，无疑是落井下石。

0一、郭达雅其人

郭达雅1995年出生在广东珠海，2014年考入中山年夜学数据科学与计较机学院。年夜四时入选中山年夜学与微软亚洲研究院结合造就博士生项目，于印鉴传授及周明博士引导下攻读博士学位，研究标的目的是天然语言处置惩罚。

2020年得到微软学者奖学金，这个奖项每一年只授予亚太地域12名博士生。2023年博士卒业后，他插手DeepSeek担当研究员，专注代码智能及年夜语言模子推理。

郭达雅于博士时期的一个细节值患上留意。他于微软亚洲研究院实习时，别离于EMNLP及NeurIPS这两个顶会发表了论文。

假如根据中山年夜学的卒业要求，郭达雅于博士入学的第三天，就已经经完成为了博士学位最难的论文发表要求。

他本人于接管采访时也提到了这件事。那咱们没关系挑一篇此中影响力最高的来一路过一遍。

2020年，郭达雅作为配合*作者，于EMNLP 2020上发表了CodeBERT。另外一位配合*作者是哈尔滨工业年夜学的冯章印。

CodeBERT是*将双模态预练习的效果做到跨语言通用的SOTA，它能同时处置惩罚天然语言及编程语言。于此以前，BERT等预练习模子，虽然于天然语言处置惩罚范畴取患了乐成，但针对于编程语言的预练习模子研究相对于匮乏。

CodeBERT的焦点立异于在引入了替代标志检测使命。传统的掩码语言建模只能使用配对于的天然语言-代码数据，而替代标志检测借鉴了ELECTRA的思惟，经由过程检测天生器孕育发生的貌同实异的替换标志来练习模子。

这使患上CodeBERT可以或许使用年夜量单模态代码数据，年夜年夜扩大了练习数据范围。模子于代码搜刮及代码文档天生使命上取患了其时的*机能。

或者者我换一种方式来描写，CodeBERT它能让AI既能读懂人类语言的需求描写，又能理解代码的逻辑布局。好比你用中文说“给我找一个排序算法”，它就能帮你找到相干的代码；或者者你给它一段代码，它能用人话注释这段代码于干甚么。

虽然此刻看来这没甚么，可这篇论文是2020年发表的，于其时，代码就是代码，天然语言就是天然语言，这二者之距离着一条通河汉。

是以，CodeBERT的呈现，实在可以被看作是现如今Vibe Coding的初步。

插手DeepSeek之后，假如你要问郭达雅介入过的最有影响力的学术结果，那必定长短DeepSeek-R1莫属了。

但若你要问排名第二的是哪篇，那我告诉你，谜底不是DeepSeek-V3，而是DeepSeekMath。

DeepSeek-V3的技能陈诉援用数目为3890，而DeepSeekMath的援用数目为5182。

2024年2月，郭达雅作为焦点孝敬者介入了DeepSeekMath的研发。这是继郭达雅以*作者身份发表DeepSeek-Coder后的又一力作，这个项目的方针是晋升年夜语言模子于数学推理方面的能力。

DeepSeekMath的要害立异是引入了GRPO，即群体相对于计谋优化。这是近端计谋优化PPO的一种变体。

传统的PPO需要练习一个自力的价值函数模子，这增长了内存利用及计较开消。

以是GRPO爽性直接抛却了对于自力价值函数模子的依靠，转而经由过程群体内的相对于比力来预计上风，是以降低了练习资源需求。

GRPO的事情流程是如许的：对于在统一个数学问题，模子天生多个候选谜底，然后按照这些谜底的准确性举行排序，将准确谜底的几率提高，过错谜底的几率降低。

如许一来，年夜模子于下次碰到近似问题就知道该怎么做了。

这类要领不需要分外的价值收集，只需要一个可以或许验证谜底准确性的奖励函数。于数学推理使命中，奖励函数可以直接查抄终极谜底是否准确。

相称在让模子于判定问题的时辰，又快又正确，要害是还有节省了内存占用。

颠末GRPO强化进修优化后的DeepSeekMath-RL 7B，于无外部东西、无投票集成的前提下，于MATH基准上取患了51.7%的成就，这及同期的Gemini-Ultra及GPT-4靠近，于其时的开源年夜模子范畴，已经经很是可贵了。

是以，GRPO于厥后也被运用到了DeepSeek-R1的练习傍边。

0二、郭达雅去哪？

实在假如我们从技能孝敬的角度看，虽然梁文锋、罗福莉的知名度更高，可是郭达雅对于DeepSeek的孝敬要比他们俩都高。这点及公家认知是相反的。

梁文锋的作用是提供研究标的目的及资源撑持。他于多篇论文中的签名位置凡是靠后，注解他不是重要的技能孝敬者。

罗福莉虽然也介入了DeepSeek-V2的研发。不外从论文作者名单看，她的名字并无标注为焦点孝敬者。

言归正传，于agent的素质，就是代码理解（Code Understanding）、代码天生（Code Generation）及步伐综合（Program Synthesis）这三件事。

而偶合的是，从CodeBERT最先，郭达雅的研究标的目的就是云云。

是以我认为，郭达雅的去职，对于在DeepSeek来讲，影响长短常年夜的。

除了了前文提到的CodeBERT，郭达雅还有主导了GraphCodeBERT及DeepSeek-Coder。

前者是让AI能理解代码中变量之间的依靠瓜葛，好比说改了a会影响b，改了b又会影响c。这对于代码重谈判修复Bug尤其有帮忙。

后者则是经由过程撑持多种编程语言及更长的上下文，让模子能一次性理解整个项目的代码架构。DeepSeek-Coder-V2的代码机能与同期的GPT-4 Turbo相称。

2024年的时辰，字节从阿里挖走了周畅。周畅于阿里通义千问卖力多模态相干研究，插手字节后担当Seed视觉多模态卖力人，主导Seedream及Seedance的研发。

2026年春节，周畅交出了于字节的*份答卷Seedance 2.0，依附“导演级”的视频天生能力于全世界规模内激发惊动。

此刻，传言字节多是郭达雅的下家之一。周畅补强的是视觉多模态，假如传言为真，郭达雅要补强的，是代码智能及推理能力。

字节Seed团队于2025年头履历了一次重组。

吴永辉接受后，打破了模子部分间的数据壁垒，组建了三层架构：Edge团队卖力长周期的AGI课题，Focus团队卖力焦点技能攻坚，Base团队确保当前一代模子的不变交付。

从技能匹配度看，郭达雅最可能卖力的，是代码年夜模子的全链路技能攻坚。

好比说主导字节Code-LLM的下一个迭代之类的。

由于郭达雅擅长预练习架构优化、超长上下文适配、多语言撑持等焦点技能的研发，以是他极可能会为字节带来那种“项目级”的代码天生agent。

第二个焦点标的目的是推理能力。

今朝字节Seed团队的焦点战略之一，就是类o1的通用推理年夜模子，郭达雅假如插手，将直接给字节带来行业最成熟的GRPO落地经验。

他年夜几率会卖力推理标的目的的强化进修算法研发，优化豆包年夜模子的数学推理、多步逻辑推理、繁杂使命拆解能力。

第三个标的目的是数学推理专项模子研发。

数学推理能力是年夜模子通用逻辑能力的焦点底座。Seed团队专门设立的Edge团队，聚焦3年以上的持久AGI基础研究。

而且取缔了短时间季度查核，答应团队投入资源做摸索性研究。

郭达雅所介入过的DeepSeekMath，恰是这个标的目的。

假如郭达雅选择插手baidu，他一样能于代码智能范畴阐扬主要作用。

前文提到，文心快码于2026年3月方才完成为了庞大进级，更新的重点是多agent协同。

它详细的协同方式是：Plan agent卖力需求澄清及使命计划，Architect agent经由过程SubAgents机制拆解繁杂使命，每一个子agent拥有自力上下文，以解决长Context下的“遗忘”问题。

而郭达雅恰好研究过这套全链路环节上的每个节点，换句话说，baidu正于做的工作，及郭达雅的研究标的目的彻底重合了。

是以，假如他插手文心团队，极可能会卖力优化这些agent之间的协同机制，晋升代码天生的正确性及项目级理解能力。

说到挖角DeepSeek焦点人材，阿里也不容轻忽。2026年3月初，阿里通义千问技能卖力人林俊旸于社交平台忽然公布去职。

更糟糕糕的是，除了了林俊旸外，千问于2026年还有掉去了后练习卖力人郁博文、代码模子卖力人惠彬原等多名技能主干。

就于这个要害时刻，阿里CEO吴泳铭于3月19日的财报德律风会上放出狠话，说当前阿里的ATH事业群，更高优先级是“打造智能能力最强的模子”。

这时候候，假如阿里可以或许引进郭达雅如许的*专家，那无疑是一箭双雕。既能弥补林俊旸去职留下的技能空缺，又能直接得到DeepSeek于代码智能及推理能力方面的焦点经验。

讲真的，比起迟迟不发V4的DeepSeek，郭达雅有理由趁着年青，去字节或者者baidu、阿里做出点成就。

0三、DeepSeek-V4还有会来吗？

2026年1月初，外媒援引两名知恋人士的动静称，DeepSeek规划于春节时期推出下一代旗舰模子V4。动静还有提到，V4 于内部测试中的编程能力已经经逾越了Claude 3.5 Sonnet及GPT-4o。

这个动静让整个AI圈都高兴起来。

自2025年1月20日发布 DeepSeek-R1 以来，DeepSeek没有发布过任何一个年夜版本的迭代，最新的模子也只到了DeepSeek-V3.2。

春节来了，V4没来。

2月11日，有效户发明DeepSeek的App版本号更新为1.7.4，上下文窗口从128K晋升至1M，常识库截止时间更新到2025年5月。

社区马上沸腾了，各人纷纷于猜，说这就是传说中的V4灰度测试吗？

但靠近DeepSeek的人士很快给出了否认谜底：“这不是V4，就是一个小版本更新。”

随后外媒又报导称，DeepSeek将于3月2日发布 V4。报导还有暗示，V4 将针对于国产芯片举行优化，是该系列年夜模子中*个彻底基在国产算力生态的版本。

这一动静很快被年夜量海内媒体转载。

3月2日到了，无事发生。

紧接着第二天，又有动静称V4“极年夜几率”将于本周发布，还有有泄露的基准测试数据显示，V4于HumanEval上患上分 90%，作为对于比，DeepSeek V3为82%。

事实上，HumanEval只是一个入门级的代码天生基准测试，今朝已经趋在指标饱及，底子没法完备区别*代码年夜模子的真实能力，以是其时我就感觉这是个假新闻。

果然，眼瞅要到4月了，V4依然没有呈现。

此刻还有有报导称DeepSeek-V4估计于2026年4月正式发布，重点晋升持久影象能力，并深度适配国产芯片。

延期的缘故原由众口纷纭。有人说是模子范围膨胀致使练习进度延迟，还有有人说是多模态功效的整合比预期繁杂。

但有一个细节值患上留意，V4的焦点卖点之一，就是“*编程能力”。按照泄露的信息，V4能处置惩罚30万行代码逻辑链。

而郭达雅，恰是DeepSeek于这一块的顶梁柱。

DeepSeek的焦点研究职员未几。从论文作者名单看，常常呈现的名字不跨越20个。

于如许一个精英小团队里，每个都是不成缺乏的，更况且他还有是郭达雅如许的超等年夜牛。

原理就摆于这了，假如V4乐成了，申明DeepSeek找到了替换者，或者者团队乐成完成为了技能交代。

假如V4再次延期，或者者代码能力没有到达预期，那末郭达雅去职的影响就会真正闪现出来。

从此刻的环境看，DeepSeek正于履历一场严重的磨练。它需要证实，纵然掉去了焦点人材，它依然可以或许连结技能立异的节拍。

【本文由投资界互助伙伴微信公家号：字母榜授权发布，本平台仅提供信息存储办事。】若有任何疑难，请接洽（editor@zero2ipo.com.cn）投资界处置惩罚。

-今年会jinnianhui官网

下一篇：和合共生积极有为——今年会jinnianhui官网集团2025年度工作总结会顺利召开