当前位置:首页 > 汽车 > 正文

DeepSeek爆火,银行下场“吃螃蟹”

  • 汽车
  • 2025-02-07 20:16:19
  • 20

  来源:国际金融报

  “最近我们都在讨论DeepSeek,虽然还没到应用层面,但都在想怎样跟上这波浪潮。”一位银行人士对《国际金融报》记者感慨道。

  近日,DeepSeek在全球迅速走红。《国际金融报》记者注意到,目前,江苏银行已引入了新模型,也有银行将之用于宣传,而该新工具在银行大模型应用方面的技术突破价值更是引发业内人士深思。

  受访专家指出,随着DeepSeek及今后人工智能(AI)模型不断迭代,单次推理计算成本逐步降低,算力基础设施产能将逐步提升,这标志着大模型应用从“技术可行性验证”转向“经济可行性落地”的关键拐点。

  银行下场“吃螃蟹”

  2025年初,总部位于杭州的幻方量化旗下AI公司深度求索(DeepSeek)研发的DeepSeek-R1模型横空出世,迅速成为春节期间的大爆款。只需点开深度思考和联网功能,再简单输入指令,一位博文广识的“赛博好友”便出现网络另一端。本土化的数据库赋予其极高的遣词造句能力,较ChatGPT更低的价格门槛使其飞速传播,仿佛只是一夜之间,DeepSeek就成为了网络时尚单品。

  也有银行借DeepSeek的火爆,趁热打铁地做了场别样的宣传。《国际金融报》记者注意到,在近日的一则推送中,海安农商银行通过与DeepSeek对话的形式,从资本实力、市场份额等多维度做了深度、全面的自我介绍,十分吸引眼球。

  而在娱乐大众的功能之外,DeepSeek还引发了行业人士更深层次的思考。记者在采访中发现,DeepSeek模型的技术突破价值成为多位专家的关注点。

  近年来,做好数字金融大文章、推进数字化转型已成为银行业的共识。在近两年的财报中,有多家上市银行针对人工智能大模型的发展表达了积极态度,并披露了发展人工智能大模型的规划或进展。

  此次,江苏银行成为上市银行中第一家“吃螃蟹”的机构。据公众号“苏银数字金融”披露的消息,江苏银行依托“智慧小苏”大语言模型服务平台,成功本地化部署微调DeepSeek-VL2多模态模型、轻量DeepSeek-R1推理模型,分别运用于智能合同质检和自动化估值对账场景中。

  “DeepSeek模型所具备的应用能力多元,拥有强大的逻辑推理和自然语言处理水平,能够实现高性价比的部署。”素喜智研高级研究员苏筱芮对记者指出。

  浙商证券研报显示,DeepSeek-V3整个训练过程仅用了不到280万GPU(图形处理器)小时,相比之下,美国互联网巨头元宇宙平台公司(Meta)发布的Llama3-405B的训练时长是3080万GPU小时。DeepSeek-V3的训练成本约为557.6万美元,而OpenAI(美国开放人工智能研究中心)为聊天机器人ChatGPT发布的语言模型GPT-4的训练成本则高达数亿美元。

  为何此次新模型的发布引发金融界的广泛关注?苏筱芮认为,除物美价廉的因素外,DeepSeek与其他一些AI大模型有所不同的是,其母公司专长于私募基金,拥有更强的金融基因。

  国金证券计算机首席分析师孟灿在接受采访时分析,DeepSeek具备客户视角思维和上下文理解的核心优势,从经营角度来看,AI思考的路径呈现与人工审核结合,可以提高银行决策的严谨性和专业性。

  须重视安全性与准确性

  中国银行业协会在此前发布的《2024年度中国银行业发展报告》指出,金融与人工智能有天然的契合点,AI大模型技术能够充分挖掘银行业的海量数据(维权),而银行业具有适用AI大模型技术的丰富场景。当前AI大模型正推进我国银行业服务、营销、产品等领域的全面革新,催化“未来银行”加速到来。

  随着生成式AI技术加速渗透金融业,银行业对大模型的探索已从早期技术验证迈向规模化应用阶段。当前AI大模型在银行业的落地路径为何?有何风险与挑战?

  “自ChatGPT问世以来,银行就已经投入了大量资源进行算力储备和自有金融大模型的开发。在DeepSeek以及今后新的人工智能模型不断迭代的过程中,单次推理计算成本逐步降低,意味着算力基础设施产能将逐步提升,这也标志着大模型应用从‘技术可行性验证’转向‘经济可行性落地’的关键拐点。”一位银行业资深人士告诉记者,“前期Kimi、豆包的营销热潮和此次DeepSeek传播热度,也在全社会实现了AI的普及教育,公众对金融行业AI应用的接受度会进一步提升,而国家对人工智能产业的战略扶持与规划,也将对后继产业人才培养带来很大帮助。”

  银行是经营管理风险的机构,如何妥善处理人工智能大模型引入的安全风险问题非常关键。

  “在AI当前应用中,我们面临的较大困扰是AI幻觉,即AI对输入数据的误解、过度泛化或在推理过程中的错误。可以说AI‘想象’出了某些不存在的事物或信息,就像人类在梦中或幻觉中看到的事物一样。”上述银行业人士向记者进一步介绍道,“这就要求我们对错误信息进行识别,一方面,借助DeepSeek开源的可解释性工具链,使模型决策路径透明度提升;另一方面,对企业的知识库进行隔离,避免产生信息污染,并导致恶性循环。”

  孟灿也指出,在大模型的使用过程中,银行需要重点注意数据安全问题,把握好关键数据的边界。“AI大模型与客户的每次对话都涉及客户隐私。此外,数据被动收集可能涉及知识产权等问题”。

  “从长远来看,银行或将逐步完成基于AI应用的金融服务生态变革。”孟灿指出,“从生产力角度来看,过往基于问答的模式将转变为信息的全面服务,服务效率、服务准确性和客户满意度会提升,银行决策的风险性会降低。从生产关系来看,银行自身的组织结构或将变化,与客户的关系会更融洽。生产资料方面,银行服务的软硬件适配也会发生改变。”

  苏筱芮在采访中表示,人工智能大模型的应用在智能营销、智能风控等多个细分场景具备长远的应用潜力。后续或将有更多持牌机构加入到AI升级的浪潮中来,在提升传统金融业务质效的同时,为金融安全、用户资金账户安全保驾护航。

  为何目前使用DeepSeek工具的银行尚少?上述业内人士指出,许多银行开发金融大模型较早,虽然采用了分层的松耦合架构,但接口适配调整、知识库的再训练都会影响模型迁移。但开源技术框架真正触发了全行业的AI军备竞赛,随着更多云计算平台支持DeepSeek,会加速模型迁移。

  “银行发展大模型,根本竞争力来自于三个方面。”该人士最后分析指出,“其一是企业能否真正形成完善的知识基座,打通知识孤岛、碎片场景和反馈断层,将业务及客户反馈等形成企业的向量知识库;其二是能否做好防火墙,即数据的隐私保护和风险隔离,通过数据、模型和应用层联动,构建模型全生命周期管理;其三是生态协同能力,要在拥有足够业务场景反馈的基础上,为客户做减法,以尽可能简洁、核心的信息呈现,解决客户的问题。”

有话要说...