GPT 凭借强大的语言理解、内容生成能力,被广泛用在包括金融、医疗、法律等各行业,赋能包括编程、 客服、学习、工作、科研等各类场景,极大提升了人们的生产力,甚至部分迭代了某些工作范式。
1.1 增强文本关键词识别与分类总结能力
GPT 对语言的深度理解,可以通过分析关键词句总结归纳全文信息。Zoom 利用 GPT-4 进行会议记录处理 Zoom 正在与 OpenAI 合作开发一种新的语音翻译功能,该功能利用 GPT 技术来实现实时语音翻译。Microsoft Teams 利用 GPT 技术可以用于自动转录会议记录、提取关键信息和语音转文本等方面,使得 Teams 在语言处理 方面更加智能和高效。Be My Eyes 使用 GPT-4 改进视觉辅助功能,其使用 GPT 来实现更自然、更人性化的对话 交互,从而更好地满足视障人士的需求。
1.2 增强文本含义分析能力
GPT 对语言的深度理解,能够增强专业领域的文本含义分析能力。在医疗领域,DAX Express 与 OpenAI 合作,使用 OpenAI GPT 技术来改进其病历记录系统,使其能够更准确地识别医学术语、诊断和治疗方案,并 帮助医生更快地制定治疗计划。在金融领域,Morgan Stanley 正在使用 OpenAI 的 GPT 技术来帮助其分析员和 客户分析公司业绩报告,优化其财富管理知识库。使用 GPT 技术,分析员可以更快速地阅读和理解公司业绩报 告,从而更快地帮助客户做出投资决策。Bloomberg 正在使用 OpenAI 的 GPT 技术来改进其新闻报道和市场分 析。
1.3 强化机器翻译理解能力
GPT 对语言的理解和生成、小样本学习能力能够强化机器翻译推理能力。目前 GPT-4 不但可以实现较为准 确的冰岛语翻译(之前 GPT-3 和 ChatGPT 都还无法完成)还可以创造一首来自北欧神话的古代冰岛诗,甚至是 根据冰岛当地的文化特点进行相应问题的回答,这极大地推进了对这一类小众语种的保护。
1.4 增强市场营销分析能力
GPT 的强大学习能力和内容生成能力能够实现更好的市场营销分析。New Bing 结合 GPT-4 的搜索引擎: Microsoft 正在使用 OpenAI 的 GPT 技术来提升搜索引擎 Bing 的搜索结果的相关性和质量,并展现实时搜索趋 势及舆情分析。 Shopify 电商平台助手:利用 GPT 技术来提高其电子商务平台上的搜索和推荐功能。通过分析顾客的搜索 历史和购买记录,GPT 可以生成更准确的推荐商品列表,并提高搜索结果的相关性。这使得顾客能够更轻松地 找到他们需要的商品,从而提高了购物体验和销售额。 Instacart 零售平台助手:利用 GPT 技术来提高其智能购物清单应用程序的功能。通过分析顾客的购物历史 和购买记录,GPT 可以生成更智能的购物清单,包括智能建议,如何购买更高品质的商品,并更好地了解顾客 的偏好。这使得顾客能够更轻松地完成购物任务,从而提高了用户体验和购物转化率。
1.5 强化恶意侦测与风险控制
GPT 对于语言的深度理解能够侦测风险。 Feedzai 金融欺诈检测和预防:应用人工智能使金融欺诈调查人员能够使用链接分析图技术可视化和识别复 杂的金融犯罪模式并实时采取行动,进一步提高欺诈检测的准确性和效率,以保护企业和个人免受欺诈和金融 犯罪的侵害。 Stripe 结合 GPT-4 的支付平台: Stripe 是一个支付平台,借助 GPT4 的能力进行更好地服务客户、回答技 术问题以及识别虚假信息。通过分析 Discord 中帖子的语法,就会发现欺诈团队,以方便相关工作人员将他们清 除。
1.6 强化机器内容生成能力
GPT 的多模态内容生成能力助力机器内容生成。在文字生成领域,Elicit 可以论文辅助写作。Elicit 是一个 学术研究助手,其利用语言模型来让学术研究者的工作变得更加便捷和自动化。目前,Elicit 主要可以帮助研究 者完成文献综述。多层筛选精细检索,模糊词联想检索等。BuzzFeed 可以生成新闻标题与文稿: 使用 GPT 模型 生成文章标题和文稿。使 BuzzFeed 的编辑更快地创建和发布内容,并为读者提供更清晰和精简的文章摘要和标 题。可以使其快速生成更多准确和更有指向性的内容,同时减少人工编辑和创作的工作量。

1.7 增强对话能力,助力客户服务
GPT 的文字理解与生成能力助力客户服务。Salesforce 使用 GPT-4 为其数字化助手 Einstein Assistant 提供助 力,例如通过 GPT-4,Einstein Assistant 可以分析用户的情感和需求,以此为客户提供针对性的问题回答。Zendesk 和 GPT 的合作主要涉及到了自然语言处理和人工智能方面的应用。Zendesk 利用 GPT 技术,构建了一个基于机 器学习的客户服务语义模型,可以更好地理解和分析客户服务请求,并根据每个客户的特定需求量身定制的高 效服务。CoCounsel 是法律人工智能公司 Casetext 旗下的人工智能法律助手,整合 GPT-4 后,其可以帮助律师 提升工作效率,更好地服务客户。
1.8 辅助教学
GPT 的内容生成、多轮对话能力能够辅助教学。Duolingo 使用 GPT-4 升级伴学系统,利用 GPT 技术提供 更智能的搜索功能,以帮助学生更轻松地找到他们需要的学习资源。Khan Academy 利用 GPT 技术来改进其在 线学习平台的自然语言理解和智能助手能力,例如 GPT-4 像人类一样多轮对话的能力使得 Khan Academy 能够 向每个学生提出个性化的问题,以促使其更深入地学习。为教师提高工作效率:教师可以利用 Khanmigo 编写 课堂提示或为课程创建教学材料。
2.1 安防视觉
安防行业未来将向智能化深度发展,智能安防市场规模也将持续增长,天网工程和雪亮工程等国家政策整体推动了 AI 安防的发展,越来越多的 AI(人工智能)和 CV(计算机视觉)公司开始将安防领域作为其主要发展点之 一。2021 年国内智能安防市场规模达到 644 亿,2022 年及 2023 年市场规模预计持续增长达到 811 亿、1022 亿。

随着技术的不断进步,计算机视觉在安防领域的应用也变得越来越普遍和重要,现阶段计算机视觉在安防 领域的主要应用有: 智能监控摄像头:智能监控摄像头是最常见的安防应用之一。计算机视觉技术可以用于自动检测异常行为、 识别人脸和车牌等等,从而提高监控的准确性和效率。通过计算机视觉技术,监控系统可以自动识别特定事件 的发生,例如人员进入限制区域、车辆在禁止停车区域停放等。这些事件的发生将自动触发报警或通知保安人 员,以便及时采取行动。此外,计算机视觉还可以识别其他异常事件,例如火灾、烟雾、盗窃等,从而增强监 控系统的安全性和可靠性。
车辆识别:车辆识别技术可以自动检测违法行为,例如在道路上检测交通违法行为,或者在停车场中识别 车辆以进行智能管理。车辆识别技术可以通过识别车牌号码或其他车辆特征来确定车辆的身份。这种技术可以 帮助保安人员自动识别违法行为,例如超速行驶、停车场空位检测、闯红灯等,从而保证道路的交通安全。
2.2 工业机器视觉
工业机器视觉是软硬件一体化的集成系统,它的目的是代替人眼对被测物进行观察和判断。从组成上,机 器视觉系统硬件设备主要包括光源、镜头、相机等,软件主要包括传统的数字图像处理算法和基于深度学习的 图像处理算法。系统工作时首先依靠硬件系统将外界图像捕捉并转换成数字信号反馈给计算机,如下图深灰色 方块所示过程,然后依靠软件算法对数字图像信号进行处理,如下图中灰色方块所示过程。工业机器视觉在识 别的精确度、速度、客观性、可靠性、工作效率、工作环境要求、数据价值方面都优于人眼。
全球机器视觉市场规模稳定增长,国内机器视觉市场增速明显。据 Markets and Markets 和 GGII 数据,2016-2021 年,全球机器视觉行业规模销售收入从 378.88 亿元上涨至 804 亿元,预计 2025 年全球市场规模将达 到 1276.05 亿元,5 年复合增长率约为 13%。据 GGII 统计,2016-2021 年,国内机器视觉行业规模销售收入从 46.87 亿元上涨至 138.16 亿元,5 年复合增长率为 24.1%,领先同期全球复合增长率约 10 个百分点。在技术、 产业、政策等多方利好因素的推动下,国内机器视觉销售规模将进一步提速扩增,预计 2022 年销售额将达到 168.88 亿元,未来至 2025 年中国机器视觉行业销售收入规模有望达到 349.03 亿元。(注:2021 年因原材料价格 普涨,中游企业产品价格上涨 20%,因此同期按销量口径统计的增速小于以销售额口径统计的市场规模增速)
随我国制造业转型升级,应用场景逐步拓展,重点赛道需求高增。我国早期机器视觉主要应用于消费电子、 半导体、汽车三大行业。这些行业整体对于设备精度、准确度、稳定性要求较高。近年来,随着我国制造业整 体转型升级,向智能化、自动化方向发展,机器视觉技术与相关设备得以渗透进入更多下游应用行业,如电池、 机器人等。从下游应用行业增速上看,锂电池、新能源汽车行业在 2021 年增速最快,分别实现增速 181%、150%。 下游应用行业的快速发展与工业机器视觉在产线中渗透率的逐步提升,带来了工业机器视觉的需求高增,锂电池、新能源汽车行业的需求增速分别达到 30%、25%。
机器视觉在锂电行业的渗透率逐步提升。随着锂电池制造智能化、自动化程度的提升,机器视觉产品开始 广泛地应用于锂电池设备生产的各个工段。从前段工艺的涂布辊压,到中段工艺的电芯组装,再到后段化成分 容之后的检测以及模组 PACK 段,机器视觉应用渗透率在逐步提升。 锂电行业中品质管控需求明确,竞争格局优秀。早期的锂电行业扩产往往较少考虑质量管控,但随着行业 逐步从高速发展转向高质量发展以及用户对于锂电安全的更高需求,机器视觉已经成为锂电池生产企业解决质 量和效率问题的必然选择,据 GGII 预测,锂电机器视觉检测系统市场规模将保持高速增长,未来 5 年年复合增 长率在 40%。竞争个局方面,在 3C 电子和汽车等行业中的机器视觉中海外巨头有着更加强的技术积累和长期 合作关系,对于我国机器视觉企业的市场拓展产生一定阻碍,但锂电池行业是近年来在我国发展起来的新兴产 业,因此其中锂电企业与我国机器视觉企业协同配合发展而来,国产化程度较高。 我们认为,锂电行业行业整体增速较快,且锂电中的机器视觉具备行业增速高、需求明确、竞争格局优秀 的优势,在未来两三年内有望维持高增速,是最具潜力的下游应用市场 。
半导体行业对机器视觉需求明确,应用较为成熟广泛。半导体产业具有集成度高、精细度高的特点,人眼 视觉能起到的检测作用相当有限,对于机器视觉需求明确。基于此特点,半导体产业是机器视觉技术最早大规 模应用的下游领域之一,覆盖半导体外观缺陷、尺寸、数量、平整度、距离、定位、校准、焊点质量、弯曲度 等检测,晶圆制造中的检测、定位、切割和封装过程全程都需要机器视觉技术的辅助。 高端半导体检测设备主要被海外巨头占据。由于海外巨头在半导体检测领域的先发优势,因而目前半导体 机器视觉中的高端市场主要被海外龙头占据。同时,因为半导体行业的生产要求很高,因此导致国产机器视觉 厂商往往难以直接进入这一领域。国产厂商目前通过核心零部件和系统的销售逐步进入中低端市场,或通过收 购方式布局半导体检测设备。 我们认为,高端半导体检测是我国需要重点突破的高端技术,短期市场进入存在一定压力,但看好长期国 产化替代趋势。
2.3 卫星遥感
行业快速发展,行业维持高需求。卫星遥感是指从地面到空间各种对地球、天体观测的综合性技术系统的 总称。可从遥感技术平台获取卫星数据、由遥感仪器以及信息接受、处理与分析。遥感技术是正在飞速发展的 高新技术,它已经形成的信息网络,正时时刻刻、源源不断地向人们提供大量的科学数据和动态信息。从应用 领域来看,近几年遥感卫星在社会生产和生活各领域的应用范围不断扩大,中国民用遥感卫星系统研制工作取 得了显著成绩,逐步形成了气象、海洋、陆地资源和科学试验等遥感卫星系统,也具备了一定的应用基础。同 时,特种领域、自然资源、交通、智慧城市等行业对遥感信息快速提取挖掘有持续增长的需求。
AI+遥感应运而生,大模型价值突显。遥感的发展,主要分为两条线:一是增加遥感数据的精密度,例如 通过卫星采集到更高清的图像;二是强化对图像等数据的“翻译”能力,即准确识别各类图像信息为各场景应 用提供支撑。其中,传统卫星数据处理过程需要人工的大量干预,严重制约了遥感产业的发展,AI+遥感应运而 生,通过人工智能的方式,可以大幅度提升既有数据的利用深度,并强化对遥感信息的翻译能力,输出更加精 细化、更加准确的结果,但传统 AI 小模型每解决一个具体场景问题,都需要从基础数据和算法开始计算,随着 需求的不断提升,卫星遥感亟需更高效的算法,这时候,大模型的价值就体现出来。大模型通过大规模数据的 预训练方式规避了重复训练,在通用能力的基础上,企业或开发者只要在预训练模型基础上进行微调,就能解决具体场景任务的应用。
2.4 自动驾驶
在自动驾驶汽车中,计算机视觉是最完全自动驾驶最关键的技术之一。从 2016 年 Tesla 发布 Autopilot 驾 驶辅助系统以来,自动驾驶一直是交通领域最前沿的发展方向。根据 Statista 数据显示,2021 年,全球自动驾 驶市场规模为 1059 亿美元,到 2030 年将达到 22176 亿美元,增长 21 倍,CAGR40%。根据 ResearchAndMarkets 数据显示,2021 年我国自动驾驶市场规模为 15.3 亿美元,到 2030 年将达到 988.9 亿美元。

计算机视觉是通过计算机对图像或视频进行分析和处理,使计算机能够理解和感知周围的环境,从而做出 相应的决策。在自动驾驶技术中,计算机视觉的作 ss 用主要体现在以下三个方面: 环境感知:计算机视觉在自动驾驶中的应用最主要的作用是通过各种传感器获取车辆周围的环境信息,包 括图像、激光雷达、超声波传感器、毫米波雷达等。这些传感器可以获取车辆周围的障碍物、道路标识、行人、 交通信号灯等信息,从而帮助车辆做出正确的决策。计算机视觉技术可以通过对这些信息的处理和分析,实现 自动驾驶车辆对周围环境的感知和识别。具体来说,环境感知主要包括以下几个方面: 目标检测和识别:自动驾驶汽车需要对周围环境中的障碍物、行人、车辆等进行检测和识别。目标检测和 识别技术可以通过计算机视觉技术来实现,常见的算法包括卷积神经网络(CNN)、目标检测算法(如 YOLO、 Faster R-CNN 等)等。这些算法可以在车辆周围的图像和激光雷达数据中识别出不同的目标,并为车辆做出正 确的决策。
路径规划:路径规划是自动驾驶汽车中的一个重要环节。路径规划技术可以通过计算机视觉技术对车辆周 围环境进行分析和判断,从而实现行驶路线的规划和优化。具体来说,路径规划主要包括以下几个方面: 车道线检测和识别:车道线是自动驾驶汽车行驶的重要参考线,车辆需要通过识别道路上的车道线来确保 自身的行驶方向。计算机视觉技术可以通过对车辆周围图像和激光雷达数据的处理和分析,实现车道线的检测 和识别。常见的算法包括卷积神经网络、Hough 变换、Canny 边缘检测算法等。
车辆运动状态估计:自动驾驶汽车需要对自身的运动状态进行准确的估计,包括车速、加速度、方向等。 计算机视觉技术可以通过对车辆周围图像和激光雷达数据的处理和分析,实现车辆运动状态的估计和预测。 环境地图的构建和更新:自动驾驶汽车需要通过环境地图来规划行驶路线和做出决策。计算机视觉技术可 以通过对车辆周围环境信息的获取和分析,实现环境地图的构建和更新。环境地图可以包括道路几何信息、交 通信号灯、停车位、充电站等信息。