当前位置>首页>资讯>服装信息> 闻力生:服装制造业必须认知AI大模型及其应用

    闻力生:服装制造业必须认知AI大模型及其应用

  • 2024/4/19 9:44:22|文章来源:中国服装协会|评论:网友评论 0 条

    中国服装智能制造联盟专家组副组长

    东华大学教授   闻力生

    2023年4月28日和5月5日党中央工作会议上提出了关于人工智能发展的三个第一次,即第一次提出“通用人工智能”,第一次提出“产业智能化”,第一次提出“要把握人工智能等新科技革命浪潮”,可见党中央对人工智能AI发展十分重视。根据AI当前发展情况来看,我们现在已经处在AI大模型时代,大模型各种各样,其参数规模不断提升,行业应用不断拓展,从整体来看,AI大模型不仅可以生成文字、可以生成图片,而且可以生成代码,构建人机交互新模式,它还能与产品研发、工艺设计、生产作业、产品运营等制造环节、场景相结合,提高生产效率,形成新的生产力,从而引发整个产业格局的重构。那么什么是AI大模型呢?它在我们服装制造业进行智能化转型中又有什么作用呢?


      一、 AI大模型定义及其相关概念  

    1) AI大模型定义与类型:

    AI大模型是指具有巨大参数量规模的人工智能模型,这些模型通过机器学习和深度学习的技术来学习和理解庞大的数据量。这些模型能够解决多种任务,适应不同的业务场景和语言环境,并且能够不断进行训练和优化,以实现更高效、更准确的语义理解和应用。

    目前市场上公司及研究院校所等发布的AI大模型一般参数量是从10亿参数到上千亿参数,根据我国科技部2023年的统计,中国10亿参数量规模以上的大模型已发布了79个,美国发布已超过100个。

    AI大模型有自然语言处理、计算机视觉和语音识别三个大领域,见图一。正因为有了这三个大领域,才构成了人工智能的丰富世界,也才能够让机器更深入地理解我们的语言、图像和声音,从而为我们人类提供更智能、更便捷的服务。

    图一  AI大模型领域

    在这三个领域中以大语言模型LLM(Large Language Model)和计算机视觉大模型CV(Computer Vision)较为常见。LLM大模型主要用于处理自然语言任务,如文本生成、情感分析、问答系统等。这类模型通过对大量文本数据进行训练,学习到了语言的语法、语义和上下文相关性,从而能够理解和生成自然语言文本;CV大模型,即计算机视觉模型,主要用于处理图像和视频相关的任务,如图像分类、目标检测、人脸识别等。这类模型通过对大量图像数据进行训练,学习到了图像的特征表示和分类规则,从而能够进行图像的分类和目标检测等任务。除此之外还有自然语言处理NLP大模型和强化学习RL大模型也是常见的AI大模型类型,但它们的应用范围相对较窄。NLP大模型主要用于自然语言处理任务,如文本摘要、机器翻译等;而RL大模型主要用于强化学习任务,并通过与环境的交互学习最优策略。总的来说,AI大模型的应用取决于具体的任务和场景,不同类型的模型各有其优势和局限性。

    当前典型的LLM大模型包括我们熟悉的OpenAI的GPT系列、Google的BERT模型等。在已经过去的2023年,最具影响的GPT-4、ChatGPT凭一己之力掀起了AI领域的热潮,火爆全球。特别是ChatGPT入选了2023年度《Nature》十大人物(Nature’s 10),这是有史以来第一次以一个“计算机程序”——非人类实体作为人物入选。同时,我国国家语言资源监测与研究中心、商务印书馆等单位联合主办的“汉语盘点2023”公布的年度国际词,同样是ChatGPT。ChatGPT让大模型席卷全球,大模型被全球科技领袖定义为一次颠覆式科技革命。

    我曾经说过,GPT是英文字首(Generative Pre-trained Transformer),可以叫“生成性预训练变换模型”,也可以叫“生成性人工智能”,是基于自然语言处理NLP基础上发展起来的大数据、大算力、大模型。现在的GPT就是新一代人工智能发展的代表,它可以说是以现在的机器学习和深度学习等为主体,在其基础上参考人脑的计算机制,构建机器的学习和推理智能系统,这些都是在Transformer模型基础上发展起来的,见图二。


    图二 LLM大模型发展的基础/大模型的发展基础

    Transformer模型是深度学习中的一种神经网络模型,该模型2017年是由Google开源的。目前Transformer模型已经成为自然语言处理领域中最流行的模型之一。Transformer架构是一种基于自注意力机制的神经网络架构,在处理序列数据和建模语言相关性方面表现出色,见图三。