通义千问
通义千问是阿里推出的大语言模型。2024年5月9日阿里云正式发布通义千问2.5,在权威基准 OpenCompass 上,通义千问 2.5 的得分追平了 GPT-4 Turbo。
对话栏
论文阅读
浏览了通义千问网页版,发现它不仅仅提供了常规的对话栏,还额外设计了不少好用的小工具,其中一个就是《工具箱》里面的《论文阅读》功能。
将论文上传到网页,即可实现全文的导读和翻译。
虽然针对部分关键术语和数学公式的翻译和排版并不准确和美观,但是确实是一件很好用的学习工具。
未来的工程师
从去年开始接触ChatGPT,到现在已经完全把它当做日常的搜索工具,虽然它不会替代传统的搜索引擎(比如百度/Google),但是大部分情况下都能够很好的提供符合我个人需求的解决方案。不仅仅是LLM,还有Midjourney、Stable Diffusion、Sora,这些LLM和AIGC工具一定能够大幅提升社会生产力,基于LLM和AIGC会产生很多新的社会需求,会有很多不一样的玩法。
算法工程师能做什么,宏观上我能想到以下几个方面,
- 研发通用LLM,类似于ChatGPT、文心一言、通义千问。
- 分析:基本做不到,不管是算力、数据还是个人知识经验都不具备,它们属于大公司和顶尖高校实验室的目标。虽然现在市场上出现了这么多通用LLM,我做一个小小的预测:参考之前平台型工具(比如搜索引擎、比如电商)的发展,通用LLM一定是强者恒强并且通吃一切,每个市场最终会剩余1到2个;
- 研发行业专用LLM,结合行业特定的深度知识提供解决方案。
- 这种方式类似于现有算法工程师的工作模式,比如我现在常用的深度学习分类/检测/分割算法,它们在学术上基于通用数据集进行创造,然后我作为算法工程师应用到现在的餐饮行业中;
- 存在风险点:因为底层架构的变化会影响上层应用的玩法。之前AI算法工程师的工作模式不一定能够全盘复制到新一代AI的应用过程中。
- 跳出工程师的角色,利用LLM和AIGC的能力向产品方向发展。
- 新一代AI能够提供更强大的生产力,从算法到技术到产品到应用,算法工程师是最早接触和吸收新一代AI的一群人,LLM和AIGC也支持算法工程师完成更多角色的工作;
- 关键在于了解自身和社会需求,自己能做什么,现实生活中需要做什么。比如行业中有什么需求是能够独立实现,并且有机会销售给别人的。