【A09】僵尸企业画像及分类【科创信息】
发布时间: 2019-11-13 15:35:43

1. 命题方向

智能计算

2. 题目类别

应用类

3. 题目名称

僵尸企业画像及分类

4. 背景说明

【整体背景】

在互联网逐渐步入大数据时代后,可以更便捷的获得企业的工商、司法、经营、上市、知识产权、舆情等多维度数据。2016年9月,国家工商总局发布《工商总局关于新形势下推进监管方式改革创新的意见》(工商企监字〔2016〕185号),指出要“依托大数据加强监管”,“充分发挥大数据在制定完善新型市场监管制度和政策中的作用,搜集掌握经营者、消费者和社会公众的反应,跟踪监测有关制度和政策的实施效果”,“在工商登记、企业监管、网络交易、竞争执法、消费维权等领域率先开展大数据示范应用”。通过对企业从业人数、成立年限、注册资本、营业收入、风险信息,行政处罚、纳税信用等级、黑名单、上市信息、电商信息等数据关联处理,按需进行权重分割,并对这些数据进行综合分析,构建出企业全息画像,整体评估一个企业综合价值,更好的勾勒出企业的经营变化情况。

如何根据企业全息画像,面向不同的应用场景对企业分类识别,分析挖掘法人、自然人、物品(包括特种设备、产品、食品等)、案事件之间的显性和隐性关系,建立市场主体信用管理与风险评估模型,对企业的信用风险、经营风险、质量风险、安全风险、关联风险等进行全面评估及分级预警,为系统监管、精准监管、高效监管提供数据支撑,越来越受到市场监管部门的重视。

【公司背景】

湖南科创信息技术股份有限公司成立于1998年,是国内智慧政务及智慧企业领域的信息化综合服务提供商,主要致力于为政企客户提供集软件开发、系统集成、IT运维等于一体的信息化综合解决方案。

科创信息注重跟踪最新技术发展趋势,在大数据、云计算、移动互联网、人工智能等领域都已创建了多个具有自主知识产权且处于国内领先地位的核心技术平台。在此基础上,按照“平台+应用”的研发模式,针对政府、企业客户的典型应用需求,逐步形成了“智慧政务”与“智慧企业”系列解决方案,客户覆盖湖南、湖北、云南、河南、北京等多省(市)党政机关及其下属公安、财政、税务、环保、医疗、教育等各级政府部门,并为中国铁路总公司、中国移动、中国联通、中国电信、中联重科、云南冶金、中建材集团等不同行业领域龙头企业提供了多项信息化综合解决方案。

依托强大的研发实力与突出的项目实施效果,公司解决方案及产品曾获得湖南省科技进步奖、国家重点新产品、中国优秀测绘工程奖、中国工业软件杰出贡献奖、中国十佳电子政务解决方案奖、中国智慧政务领域最佳解决方案奖、最佳智慧城市解决方案提供商奖等奖项,公司先后荣获国家高新技术企业、中国服务外包成长型100强企业、2017中国最具影响力软件和信息服务企业等诸多荣誉,是湖南省最具成长性的非公有制企业。

公司秉承“用户至上,品质优先”的服务理念,凭借多年的项目实施经验及良好的服务信誉,已在智慧政务及智慧企业领域形成了自己独特的竞争优势,并取得了良好的社会效益及经济效益。

【业务背景】

僵尸企业是指缺乏盈利能力却能够以低于市场最优利率成本获得信贷资源,依靠外界输血而缺乏自生能力的企业。僵尸企业的存在破坏了市场机制,加剧了信贷资源的错配,带来了严重的产能过剩问题,还对其他非僵尸企业产生了投资挤出效应。此外,由于我国金融制度不健全,僵尸企业往往会倾向于采用企业间商业信用的非正式金融方式融资,带来对僵尸企业合作关联企业的“传染”,甚至会拖累银行成为“僵尸银行”。僵尸企业如果不能够及时处置,经济动能转换以及高质量发展就无法保障,去杠杆工作的受阻将加大系统性金融风险。鉴于僵尸企业的危害性,自2015年以来,中央出台了僵尸企业处置的一系列政策指导文件,试图以处置僵尸企业作为深化供给侧结构性改革、调整经济结构以及促进经济行稳致远的重要抓手。

僵尸企业的识别标准主要有官方标准、CHK标准,FN-CHK标准以及各类FN-CHK修正标准等,官方标准定义为不符合国家能耗、环保、质量、安全等标准,持续亏损三年以上且不符合结构调整方向;已停产、半停产、连年亏损、资不抵债要靠政府补贴和银行续贷维持经营的企业。CHK标准的核心是企业是否接受信贷补贴,FN-CHK标准则包含“真实利润原则”以及“常青贷款原则”,相关的FN-CHK修正方法大部分都是对以上两类标准的修正,对企业利润与资产负债率等指标进行调整,将企业的经营管理费用、净资产水平、企业效率和创新等指标引入僵尸企业的识别标准体系中,力求从更加多维的层次反映僵尸企业的经营特征。

通过各类标准分类识别僵尸企业均有其局限性,尤其是标准的制定有其主观性,因此基于企业画像分类识别方法成为首选。

5. 项目说明

【问题说明】

命题单位已经多角度、多层次、多领域汇聚了约不同行业的5万家企业相关信息,其中定义为僵尸企业的有2千家。本任务的数据包括训练集,开发集和测试集,前期将发布训练集和开发集,测试集将在此后公布,直接用于模型评测。

企业数据一部分为通用的标签信息,其他的新增标签由参赛人员根据经验和数据本身特点,针对具体问题制订;然后通过数据治理,并采用统计、分析、挖掘等技术,完善企业画像的各维度标签;最后采用人工智能算法建立僵尸企业的分类模型,达到对企业进行合理的分类识别的目的。

【用户期望】

要求:

(1)多表数据融合的能力;

(2)数据特征提取的能力;

(3)数据预处理的能力;

(4)数据建模的能力。

目标:追求模型分类识别的精确性与高效性。

6. 任务要求

【开发说明】

需要对僵尸企业的表现形式有深入的了解和阐述。

需要依据用户期望的内容对数据的处理过程进行详细的描述。

【技术要求与指标】

具体开发技术不限,建议使用Python和R语言等。

【任务清单】

(1)模型的概述与简介,对算法模型有充分的认识理解,切不可只会套用;

(2)模型的参数调优过程(如果包含调优过程);

(3)模型的效率(包括数据预处理的效率与打标签的效率)。

【提交材料】

(1)项目概要介绍;

(2)项目简介PPT;

(3)项目详细方案;

(4)项目演示视频;

(5)企业要求提交材料:

Ø  所使用的分类方法原理与参数调优过程概述

Ø  训练后的分类方法,以及对测试集打标签结果

Ø  可视化web端开发,支持单个与批量输入查询分类结果

(5)团队自愿提交的其他补充材料。

7. 参考信息

(1)开发工具:可以借助开源的工具;

(2)数据接口:企业会通过网盘提供。

8. 评分要点

本赛题评分要点参考附件一:A类企业命题统一评分标准。

A09-科创-企业画像数据接口

承办单位

  • 国家服务外包人力资源研究院
  • 无锡市商务局
  • 无锡市教育局
  • 江南大学
订阅号