Home
cover of episode 当数据科学家遇到大模型——轻技术重应用 延缓被替代风险

当数据科学家遇到大模型——轻技术重应用 延缓被替代风险

2023/11/6
logo of podcast 前沿派对

前沿派对

Frequently requested episodes will be transcribed first

Chapters

Shownotes Transcript

【内容简介】

上月领英裁员700人,其中一大部分都是数据科学家。大模型是第四次工业革命,对数据科学的冲击影响不可小觑。在本次和加拿大滑铁卢数据科学美女讲师Sunny小姐姐的学术讨论中,我们将围绕以下关键问题进行探讨:

*1. *如何评估大模型对传统模型的冲击和影响?

*2. *大模型在企业中降本增效、个性化定制和加速研发的策略和成果是如何体现的?

*3. *在高容错和低容错场景中,大模型应用有哪些应用方案?

*4. *数据科学家如何通过商业理解来使用大模型微调和应用开发?

*5. *大模型将如何重塑劳动力市场,并对高学历知识工作者的未来产生什么样的影响?

【本期嘉宾】

Sunny小姐姐儿 <⭐️⭐️⭐️小红书同名,欢迎订阅关注>

【学习笔记】

0:00  嘉宾个人背景介绍

03:38 传统模型是科学算命** vs 生成式模型是内容创造:**

  • 学习传统模型了解底层逻辑,目前大模型成本依然很高,且模型黑盒监管难;
  • 商业➕编程➕算法的交集是数据科学,大模型前重技术 ,大模型后重应用
  • 大模型在企业中的功能定位:1)降本增效 2)个性订制 3)加速研发;
  • 应用场景从容错率高的场景:1)自动化客服;2)营销战略;3)软件工程—40%的基础代码已被替代 ≈ 40%的码农被替代;4)产品研发;5)AI制图
  • 高价值高风险容错率低的场景也可以应用:1)教育行业;2)医疗行业;3)自动驾驶
  • 范式没有行业壁垒,减少模型搭建时间,大模型一步到位

24:10 未来大模型发展方向:一部分卷模型,一部分卷应用,落地为王:

  • 卷模型:1)整体提升;2)多模态模型—缺乏GPU资源会在商业竞争中被淘汰;3)探索开源模型—打开黑盒,用大模型根据垂直领域微调生成小模型
  • 卷应用:1)ToC: 抓住客户痛点,找到刚需产品—目前AI相机、虚拟人等低风险产品,用户粘性不大; 2)ToB: 专注效益付费,拆分成小应用满足中小企业需求

36:00 解决模型幻觉:

  • 培训预料不详尽:1)grounding;2)调整创意度和token参数
  • 规范提示词语:1)涵盖更多场景;2)通过数据微调;3)根据confidence score进行人工核查;4)用第三个大模型检验相似性差异性

43:43 微调模型,数据科学家挑选数据,需要对商业更深的理解

  • 三个大手段:1)不改变参数,给提示词更多信息;2)微调参数 (100-500 label-data);3)渣男谈恋爱方式 - Reinforcement learning by human/ AI feedback (5k-1w data)
  • 提示词工程师不再是一个岗位,而是每个岗位必备的技能
  • 应用大模型需要考虑的风险隐患:反对歧视和偏袒,做好风险评级,保证harmless, honest, helpful

55:55 大模型加速劳动力转化进程,员工效率提升60-70%,人工参与的工作50%在未来10-20年被自动化替代,大模型对于高薪高学历的知识工作者冲击更大,有章可循的模式都可以被学习,律师、会计师、医生、教师都可被替代,应届毕业生需要更重视商业理解,重软实力提升,成为厨师长

63:21 提问环节:1)嘉宾作为数据科学家对未来的计划;2)作AI产品经理的软硬实力要求

70:00 如何了解更多的大模型资讯:1)公开课;2)Hugging Face;3)Google Cloud & Deep Learning 课程拿certificate;4)听播客,关注Sunny小姐姐儿小红书~

74:00 结束音乐(本期音乐:Argy & Omnya | Aria [Afterlife])

【封面背景】

本期封面由stable diffusion生成