公众号/机器之能
电网是高效快捷的能源输送通道和优化配置平台,是能源电力可持续发展的关键环节,在现代能源供应体系中发挥着重要的枢纽作用,关系国家能源安全。2010年以来,国家电网规模增长近一倍,保障了经济社会发展对能源电力的需求。随着人工智能技术的快速发展,机器智能的优势正逐渐深入各行各业。自然语言处理技术作为人工智能领域最具代表也最有难度的研究课题,能够对人类语言和文本类数据进行处理和学习。智能电网的概念与自然语言处理的结合,则能够衍生至通过文本阅读理解,文本相似度计算,知识图谱等技术,在项目招标,检测预警,维护修理,以及渠道客户等电网业务的应用场景当中落地。提升电网业务的工作效率,造福广大人民群众。
作者 | 单赢、田辰
一、电力行业的市场规模
2005年以来,智能电网关注度就逐渐提升,这既是现代电力系统日益复杂的要求。智能电网的概念是众多技术、解决方案,甚至包括政策和监管机制的合集。未来几年,新能源装机和发电量占比的提升必然趋势,电网必将围绕清洁能源消纳进行系统化的投资升级。而中东部地区兴起的大量间歇性分布式并网也需要智能配电网络的支撑。目前我国智能电网市场需求方主要是国家电网,南方电网,以及地方供电局和一些地方电力公司。目前,在市场里能够提供较为全面的智能电网解决方案的供应商还十分有限,但是大多数企业都已经开始在某个或多个细分领域逐步展开智能化的战略部署。
二、智能电网中的自然语言处理技术
文本信息抽取: 文本信息抽取主要是结合机器阅读理解,通过训练Word2vec模型,将文本数据中有效的信息识别出来,实现可以制动从文本数据中识别并抽取关键信息内容的功能。文本信息抽取的技术可以应用电网招标文档数据的结构化整理,便于招标文档的聚类和整理。同时也适用于电网企业说明文档的检测管理以及检测警报等任务
文档相似度分析:文档相似度主要是依赖文字内容语义相似度计算的技术实现的一种典型NLP技术。一般用于信息检索的和知识问答的模糊匹配。这项技术被运用与电网维修行业,维修人员可以通过提问,或关键字搜索的方式对信息量庞大的电网维修说明文档进行快速的检索。系统可以找到精准的相关内容,并生成说明内容返回给为维修人员。
知识图谱: 知识图谱能够有效的将系统当中的知识类信息进行整理与关联,从而实现信息数据质检的相互联结与沟通。针对包含专业技术和知识类文本数据组建图数据库,从而实现复杂的检索功能和智能辅助决策的功能。通过图数据库提升文本信息的检索质量,可运用电网管理监控,电网知识类智能问答客服等场景。
情感识别:感情识别技术指的是通过对工作业务当中对话内容信息的聚类和理解,识别用户在对话内容中所表达的情感信息的技术。感情识别技术主要依靠长期短期记忆(LSTM)算法,对相关业务对话语料的上下文信息进行学习,结合对话当中的语境信息,判断对话内容中所表达的情绪正负极,进而理解对话内容的话题与意图。
三、自然语言处理在电力行业的应用分布
四、自然语言处理在电力行业中应用案例
五、自然语言理解在电网业务中发展趋势
目前在电网行业中,NLP技术的主要应用场景依然是辅助业务的智能客服中心。未来,将会有更多电网业务相关的数据被挖掘和记录,届时NLP技术将会进一步的深入到电网成功具体的管理检测和维护当中。NLP技术在电网行业当中的应用刚刚起步,对数应用还在实验和探索阶段,中国国家电网和南方电网等企业正在积极与个大NLP公司和院校相关的实验室合作,共同探索人工智能技术在电网电力领域的应用,推动电网电力智能化的战略方针,更好的服务于百姓。
六、自然语言理解在电网业务中的局限性
自然语言处理技术在电网领域当中的应用依然是一个正在探索和尝试的课题。真正在实际场景中落地的项目非常有限,相关进展主要来着科研高校以及科技公司的POC项目当中。项目当中的数据多为实验数据,缺乏一定的客观性和真实性。
从目前的发展现状来看,电网行业中数据的获取和整理将会是一个较大的挑战。目前市面上还没有一个很好的针对电网领域的NLP模型。电网领域的内容具有一定的专业性,且需要进行大量有效的人工标注才能训练出一个有效的模型。另外,电网公司是比较传统的能源类企业,其工作方式以及工作系统已经形成体系,相对于其他行业来说,电网业务智能化的替换成本更大,且门槛更高。短期之内,NLP在电网行业中的应用多数还是以协助人类工作为目的,这就需要工作人员接受并掌握新的工作形式和模式。