科学技术史视角下的AI概况
我们今天所谈的人工智能(Artificial Intelligence)并不是一个21世纪的“新生儿”,从科学技术史的角度看,其滥觞于1956年的美国,出发点是用计算机模拟人类思维。纵观其近70年的发展历程,AI技术总体呈现螺旋上升的趋势,核心驱动力我认为可以概括为ABC,即Algorithm算法、Big Data大数据、Computing Power算力。
自诞生起,AI技术总体上经历了三次繁荣和两次萧条,高潮与低谷均伴随着ABC三个因素的组合发展与时代瓶颈。本文从AI的第三次繁荣期(2011年-2022年)谈起,简述十余年间的AI发展态势,并对当前正在发生的第四次繁荣做简要概括,重点谈谈AI技术和AI工具对运输行业的影响,并提供一些我近期思考的潜在应用案例,供诸君参考,抛砖引玉。
AI这十年
自2011年起,AI技术进入高速增长的黄金期。从技术角度概括,我把AI这十余年的显性应用场景分为四个方向(主要谈深度学习和强化学习):
- 针对序列数据,如文本、时序数据,实现序列数据分类、预测等任务,用于文本分类、机器翻译、机器对话等场景,代表性AI技术为循环神经网络系列
- 针对图像、视频数据,实现对象分类、目标检测、场景分割、像素分割等任务,用于各类计算机视觉应用场景如监控追踪、遥感影像变化检测、场景重建等,代表性AI技术为卷积神经网络系列
- 针对图数据,立足图论,实现对广义拓扑结构数据的AI学习和应用,如点云数据分割、各类推荐系统、生物分子结构预测等场景,代表性AI技术为图神经网络系列
- 强化学习,针对目标最大化的问题,利用一系列“动作”训练AI模型,使模型逐步掌握寻找特定领域的现实最优解的能力,如谷歌AlphaGo、王者荣耀等游戏AI
上面的四个方向,无论是技术还是应用均互有渗透,无硬性的边界,也符合现实世界中多种数据类型混合的特点(多模态数据),相应的应用也有很多,如看图说话,文本生成图像等场景,逐步模拟人类的智慧能力。
遥感影像目标检测示例
第四次繁荣
2022年11月30日,美国人工智能公司OpenAI发布聊天机器人ChatGPT,标志着AI应用进入第四次繁荣期。之所以认为chatgpt引领了AI的第四次繁荣,是因为本轮AI浪潮以前所未有的规模“破圈”,吸引了各行各业从业者的目光,AI大模型走出科研界,大步走向社会。
此后,短短数月之间,各类基于大模型的AI应用雨后春笋般出现在公众视野:有OpenAI发布的更加智能且支持在线学习的GPT4模型、谷歌的Bard,也有国内头部互联网企业发布了类ChatGPT应用,如百度的文心一言、阿里的通义千问,在特定场景下都达到了较高的智能水平。
上述模型虽然功能强大,但人类想高效使用它们却不是一件轻而易举的事(日常调戏模型的场景除外),原因在于指挥模型执行复杂任务前,需要输入逻辑清晰、提示明确、内容简练的指令,这需要一定的经验和技巧。基于这个背景,针对AI模型撰写文本指令,以测试AI模型的思维和行为,同时提供指令培训的人也变得必要,催生了一个新的职业:Prompt Engineer,即提示工程师。
针对AI模型的提示工程,近日GitHub上的新开源项目AutoGPT(https://github.com/Significant-Gravitas/Auto-GPT)爆火,该项目基于GPT4模型实现,能够根据用户的简要需求文本,在用户不需要持续提供提示文本的情况下像人类一样在完成工作过程中的自主思考,自我设问,自我解答,自动执行,可用于复杂文本撰写、项目编程、数学问题求解等场景,基于该项目,可以快速构建一个本行业的初级数字业务员。该项目具备以下特性:
- 联网进行搜索和信息接入
- 自主管理运行过程中的长期记忆和短期记忆(决定生成结果的质量)
- 基于GPT4的结果生成
- 突破现有AI极限的完全自主运行案例(作者自述)
虽然AutoGPT能力强大,但根据社区用户反馈意见看,现阶段仍然存在费用高、自我提示可能陷入死循环、多任务迁移能力差等问题,但瑕不掩瑜,通过对该应用的研判,基本可以认定,AI进化和走向应用的速度近期显著提升。
行业应用
以ChatGPT为启点的第四次AI繁荣如火如荼,生成式AI大模型也为航运业带来了潜在的应用空间和应用价值,至少有以下几种应用场景:
- 对客端-AI客服:基于生成式AI大模型搭建更加智能、推理能力更强的AI客服。当前我们能接触到的AI客服(包括但不限于航运业),其底层模式仍然以预设问答流为主,针对客户可能咨询的问题库,分门别类归纳概括为一颗“问题树”,以关键词触发,通过预设的问答形式在业务系统中检索信息回复,因此这类AI客服的最大能力栈是确定的,面对客户提出的超出预设能力范围的问题,往往需要转人工客服处理。生成式大模型在这个场景下有用武之地,有希望构建出更大的,更加自适应的能力栈。
- 对内端-AI助手:航运业的主要场景是跨区域运输,从时间、空间、业务流、信息流等诸多维度看,呈现出场景复杂,流程繁多的特点,这使得航运业公司内部事业群数量较多,员工工作内容趋向于同一赛道向深而不是向广发展,不同事业群之间的跨部门协同成本高。如能在内部高质量数据源和清晰流程的基础上,利用生成式AI大模型搭建面向内部人员的业务知识助手,员工可在权限范围内,如同请教同事一般与AI模型对话,获取其他板块准确的业务流程和知识,或能提高员工工作效率,促进企业整体工作的一致性,凝聚更大合力。
员工个人也可以在保密和合规的前提下,积极尝试各类AI工具,为未来AI工具全面介入工作、生活各个角落做好准备。推荐一个AI工具集合站:https://ai-bot.cn/
OpenAI CEO Altman近期表态称,“OpenAI正在接近大语言模型的极限,模型规模越大并不意味着模型越好,未来将有更多的方式来提升模型的能力和效用”,可以预见,短期内有关方研究的重点在于模型质量而非规模,这也为航运业研究该项技术提供了参考方向。
据了解,马士基已在其官网应用GPT4。中远海运科技日前也表示,该公司正在对ChatGPT与公司现有业务融合的应用场景进行探索研究。航运业拥抱新技术的积极性在行业数字化的浪潮下愈发提高,机会总是留给有准备的公司的。
安全与合规
科学技术是把双刃剑。国家互联网信息办公室日前公布了《生成式人工智能服务管理办法(征求意见稿)》公开征求意见。这意味着,当下备受关注的生成式AI产业将迎来首份监管文件。与此同时,美国也对相关技术制定监管新规,安全与合规问题已经成为企业应用新技术不可忽视的必修课。
现阶段,鉴于数据安全、网络安全、生成合规等因素,国内企业商用GPT4的条件尚不成熟,但也可通过开源自建模型,先行先试。这里推荐一个开源的大语言模型调用平台:闻达(https://github.com/l15y/wenda),通过使用小模型外挂知识库的方式,实现近似于大模型的生成能力,支持局域网、内网部署。
AI是未来,这一点逐渐被更多人认可,航运业和相关从业者也应持续投入持续探索,为古老的行业不断注入新动能。
微信扫描下方的二维码阅读本文