在准备充分的土壤上创造奇迹|郭达雅专访

发布人:高旭

       2024年末,DeepSeek V3如同一颗深水炸弹,惊动了全球大模型领域的研究者和开发者。

▲ DeepSeek API文档

       DeepSeek V3的诞生可谓极具革命性。性能上,DeepSeek V3在多项基准测试中,与当今最优秀的大模型GPT-4o和Claude-3.5-Sonnet 平分秋色,甚至更胜一筹。价格上,DeepSeek V3的训练成本仅为557.6万美元,远低于GPT-4的1亿美元和Claude-3.5-Sonnet 的近 1 亿美元。技术上,DeepSeek V3创新性地提出可增强训练和推理能力的技术,并与多项公开技术进行整合,实现了模型框架与工程能力的双重突破。

▲ V3 模型基准测试数据图

       每项技术的产生都离不开研究者们的辛勤工作。那么在这样一款震惊世界的人工智能大模型背后有着什么样的研究者,他们又有着什么样的故事呢?

       今天,我们有幸和DeepSeek V3核心研究员、中山大学优秀毕业生郭达雅面对面谈话,请他为我们分享自己的科研经历与DeepSeek的故事。

个人简介

       郭达雅,本科就读于中山大学计算机学院,并在中山大学人工智能学院印鉴教授和MSRA周明博士的指导下取得博士学位。目前在DeepSeek中担任研究员,其主要研究领域包括大语言模型和代码智能。

兴趣引领航学海,自学笃行致远途

      “本科生、研究生容易对自己的专业、研究方向感到迷茫不安。您有这样的经历吗?”当被问及如何保持对专业的信心与热爱时,郭达雅提到了两个关键词——热爱和自主学习。

      “我可能一开始就是喜欢计算机的,学习的过程中也没有消磨掉这份热情。”

       回顾自己的学习经历,郭达雅说初中时他的成绩并不优秀。而他成绩提升的关键,就在于他逐渐意识到自学的重要性,并培养了强大的自主学习能力。高考结束后,郭达雅怀着对计算机学习的朴素热爱,选择了中山大学计算机学院。为了能从容地适应高中到大学的巨大转变,郭达雅在高考后的暑假自学完成了大学一年级的基础课程。这使他不仅拥有了扎实的学科基础,而且有余力去参加竞赛、主动学习更多的技能和技术。

▲ 参加2022年微信大数据挑战赛(左2)

       郭达雅强调,强大的自学能力是我们独自面对、克服科研问题的根本所在,也是我们了解、学习前沿领域新事物的客观需求。“幸运的是,我在高中时期就掌握了这种能力,并在本科阶段得以运用,这使我能够顺畅地学习新事物。”这份努力与坚持,是他能够迈向优秀的底蕴。

      “我的经历表明,我并非天赋异禀,而是通过持续自主学习,走在了他人之前。这就是我的本科经历。”

良师指导明方向,科研探幽寻真理

       大四伊始,郭达雅参与了中山大学与MSRA的联合培养项目的选拔,并有幸被印鉴教授选中,进入MSRA进行实习研究。但一开始,他的科研工作并不顺利。

      “前半年我也对自己的科研路充满迷茫,没有方向,也没有产出。”

       迷茫中幸得良师指点。郭达雅在印鉴教授和唐都钰老师的指导下,最终选择NLP(自然语言处理)作为主要研究方向。他每周阅读多篇相关论文,半年累计阅读百余篇,对NLP领域的重要理论和成果有了深刻理解,对其他领域的论文也能触类旁通,并总结出一套适合自己的科研思路和论文写作方法。

      “在那半年的阅读沉淀之后,我在下半年的实验方向很明确,进展也非常迅速。每篇论文,大约一个月用于实验,两到三周用于撰写论文。”

       博士阶段,郭达雅继续中山大学与 MSRA联合培养项目,导师为印鉴教授和周明博士。郭达雅说自己“在刚入学的第三天,就完成了中大博士毕业的论文发表要求”,但他并没有因此懈怠,而是坚持主动为自己设定阶段目标,积极推动科研计划,展开调研,进行实验,写论文……郭达雅发表了多篇高质量论文这些成果的取得离不开导师的帮助,也离不开他对科研的纯粹热情和坚定信念。

▲ 郭达雅部分学术成果

大厂工作初探秘,职业发展寄厚语

       2023年7月,郭达雅加入DeepSeek并担任研究员一职。当被问到选择加入这样一个初创公司的缘由时,他说:

      “当时,我的一位师姐在 DeepSeek工作,她找到了我,跟我聊了 DeepSeek的愿景——追求AGI,推动人类社会的加速发展。这跟我的价值观是相合的。同时,DeepSeek有比较多的资源投入研发,领导层也希望打造一个有创新氛围和自由的公司。我有这样的热情去做这件事,我也想追求这样的工作环境。最终,我选择加入了DeepSeek。”

       在DeepSeek的研发团队中,郭达雅专注于代码与推理方向的研究。他探索出提升大模型推理与代码能力的有效方法,并将其成功应用于DeepSeek V3的研发中。此外,他高度重视团队协作与沟通,能够与团队成员紧密配合,共同推动项目进展。团队自由的科研氛围为他们的突破与成功提供了重要保障。

       在v3项目的研发过程中,郭达雅充分发挥了自己的专业优势和创新精神。他不断尝试新的方法和思路,勇于挑战传统观念,努力突破技术瓶颈。最终,v3项目取得了显著的成果,不仅提升了DeepSeek在AI领域的竞争力,也为他个人的职业发展开辟了新的道路。

▲ 郭达雅在deepseek的相关工作

尾声

       谈话最后,我们请郭达雅为中大学子寄语,他说:

      “时代在发展,技术也在发展。你的专业能力,可能随时会被大模型取代,但不论如何,一个人的学习能力才是最重要的“技术”。每年,我们会招很多刚毕业的学生,我们不会过于关注他的经验,我们更关注他有没有学习能力,因为我们觉得一个有学习能力,学习能力强的人,就是能够快速地学会新的东西。”

       郭达雅的博士生导师印鉴教授,得知他近期在V3模型上取得的成绩,颇为欣慰,当得知此次专访,让我们为他送上一句祝福:

      “希望他能成为中大的‘雷军’ 。”