周鸿�t:大模型自身不是壁垒 挑战在于垂直大模型深度定制

保险理财 2023-07-27 clz123 81040

  “‘360智脑’在部分场景的表现已接近国际先进水平”,9月17日,由南京市人民政府、中国信息通信研究院联合主办,南京经济技术开发区管委会、中国人工智能产业发展联盟共同承办的2023南京人工智能产业发展大会将在宁召开。三六零集团创始人周鸿�t以“垂直大模型引领新工业革命”为题发表主题演讲。

  

  周鸿�t表示,大模型不是风口和泡沫,作为新一代的生产力工具,将引领一场新工业革命,成为数字化系统的标配,赋能产业数字化发展。然而,通用大模型在企业级场景中没法直接用,存在缺乏商业深度、不“懂”企业、数据安全隐患等七大问题。对此,他提出,大模型未来的发展趋势是“垂直化”。在时机选择上,周鸿�t认为,不要等大模型完美了才做,想清楚场景就可以开始干了。

  他表示,随着开源生态的日益完善,大模型本身将不在成为壁垒,甚至以后会变得“白菜价”,真正有挑战的是如何进行垂直大模型的深度定制。他将大模型的定制分为四步:第一步是业务分析与场景的选择、第二步是数据的采集与清洗、第三步是训练企业专有大模型、第四步是开发企业场景化应用。他同时 强调,垂直大模型也要在经过市场验证、有足够能力的通用大模型基础上训练,只有这样才能达到事半功倍的效果。

  目前,中国已经进入“百模大战”。周鸿�t认为,企业在选择基础大模型的时候一定要慎重,可以从“通识性、安全性、可控性、可用性、易用性、扩展性”六个标准维度进行评估。据介绍,360的基础大模型由视觉大模型、大语言模型、多模态大模型提供支撑,形成了一个“训推一体化工具和平台”,能够为企业级用户提供一站式的大模型开发套件。

  周鸿�t透露,360的企业级AI解决方案研发构建起大模型的训练框架,把垂直大模型的数据处理、预训练、精调的复杂过程流水线化、标准化,支撑完成近20个行业垂直模型的训练和部署交付。他以“360智脑”落地城市治理场景“一网统管”为例,在大模型的赋能下,该地的事件发现、受理、分拨、跟踪、结案各个环节实现大幅提效,实现了城市安全运行管理的根本转变。

  面向各地的数字化建设,周鸿�t表示360能够为城市AI产业发展做两件事,一件是打造城市级专属大模型,助力智慧城市建设;另一件是围绕大模型做场景,建立起支撑垂直大模型训练、精调、部署的“大模型工厂”,也就是大模型的研发训练中心,360负责提供基础大模型和训练平台,发展培养一种新职业“人工智能训练师”,在带动高质量就业的同时,让大模型变得更加聪明,更加适用于企业级场景。

  演讲中,周鸿�t表示,构建企业级大模型要循序渐进,先让大模型担当“副驾驶”的角色,与现有系统保持隔离度,时机成熟之后可以发展Agent模式,让大模型不仅作为“大脑”识别人类的意图,智能化地思考分解任务,还能够长出“手脚”,自动化地使用工具、调用各种API,执行任务、解决问题,达成目标结果,成为一种通用的智能体系统。同时,他也强调,在解决大模型安全,将大模型关进笼子之前,这只是人类美好的愿望,还是要让人保持在决策回路上。