政府邮箱登录
无障碍阅读 进入关怀版 简体 繁体 个性化定制 收藏本页

您现在的位置: 首页 > 交流互动 > 在线访谈 > 问题答复整理

请问大数据审计与“智慧审计”有哪些前沿的数据分析技术?审计机关对此有哪些应用?

信息来源:市审计局 信息提供日期:2021-07-27 14:18:45 视力保护色:

  前沿的数据分析技术包括:高级数据分析、机器人流程自动化(RPA)、人工智能、数据可视化等等。目前,常用于审计领域的前沿数据分析技术主要有:机器人流程自动化(RPA)、自然语言处理(NLP)、知识图谱、复杂数据分析、网络爬虫等。

  自然语言处理(Natural Language Processing,NLP)在政府审计、社会审计、内部审计领域均有广泛的运用,它使得计算机拥有处理人类语言的能力,让计算机能够理解并使用人类的语言。自然语言处理的应用包罗万象,比如:“机器翻译”能互译多种语言;“情感分析”能够判断出一段文字所表达观点和态度的正负面性;“信息提取”能提取文本中包含的关键信息并标准化;“文本分类”可以将文档资料进行归类整理;“语言生成”能发挥计算机理解人类语言的能力,自动生成文章摘要。

  知识图谱是语义网络的知识库,以语义网络为基础,结合自然语言处理、机器学习、数据挖掘、知识表示等技术,旨在描述客观世界的概念、实体、事件及其之间的关系。通过知识图谱可以高效直观地刻画目标主体(如行政事业单位、企业、事件等)之间的关联网络,从而全维度地对目标主体进行画像,立体复现主体的真实情况和错综复杂的关系。

  网络爬虫,是一种“自动化浏览网络”的程序,即按照一定的规则,自动地抓取互联网信息,比如网页、文档、图片、音频、视频等。这种程序的运行可以实现自动、高效地读取、收集网络数据。

  目前,我局在审计实践中运用的前沿数据分析技术涉及图数据库、网络爬虫技术、NLP文本分析、地理信息系统(GIS)等。其中,图数据库主要的应用场景包括:企业审计领域中描绘企业风险图谱等。网络爬虫技术主要的应用场景包括:政策跟踪审计领域中搜集国家、其他省、市的公开政策及信息,金融和企业审计领域中搜集全国企业公开的工商登记信息、司法信息等。NLP文本分析主要的应用场景包括:经济责任审计领域中从大量会议纪要等文本文件中提取关键信息等。地理信息系统(GIS)主要应用于资源环境审计中。

  接下来,我们将继续探索图数据库、数据挖掘、机器学习、区块链等新的技术手段,持续拓宽前沿数据分析技术的审计应用场景。我们相信,入之愈深,虽其进愈难,但其见愈奇。我们将推动数字化全面赋能深圳审计工作,为落实科技强审探索更多“深圳方案”。

附件下载: