2007-2024年数实产业技术融合数据+python代码

【独家复刻】数实产业技术融合2007-2024 【使用软件】Pycharm 2024.1

参考文献:黄先海、高亚兴(2023)《数实产业技术融合与企业全要素生产率——基于中国企业专利信息的研究》,中国工业经济,第11期

指标定义:若一项发明专利的IPC主分类号属于非数字产业技术(即实体产业技术),且该专利引用的专利中至少有一项被识别为数字产业技术,则定义该专利为企业的一次数实产业技术融合行为,按企业-年份汇总后加1取对数 【核心计算步骤】

步骤一:构建数字产业技术IPC识别规则

依据:国家知识产权局2023年3月发布的《数字经济核心产业分类与国际专利分类参照关系表(2023)》。

覆盖范围:数字经济核心产业4个大类(01数字产品制造业、02数字产品服务业、03数字技术应用业、04数字要素驱动业),15个中类,86个小类。

提取规则:共提取642条IPC匹配规则,其中372条为通配符前缀匹配(如 G06F17* 表示G06F17及其所有下级分类),270条为精确匹配(如 G05B19/418)。

匹配逻辑:对任意一个IPC分类号,若其与参照表中的精确代码完全一致,或以某个通配符前缀开头,则判定为数字产业技术。

步骤二:数据预处理

数据来源:企业发明专利引用明细数据,包含专利公开号、IPC主分类号、IPC分类号、引用专利IPC主分类号、引用专利IPC号等字段。

关联企业拆分:原始数据中一条专利可能对应多个关联企业(以"、"分隔),按关联企业名称、关联股票代码、与上市公司关系三列进行一一对应拆分。

样本筛选:仅保留"与上市公司关系"为"上市公司本身"的样本;仅保留专利类型为"发明专利"的样本。

缺失值补充:对IPC主分类号缺失的专利,从该专利的IPC分类号中提取第一个进行补充;引用IPC主分类号同理处理。

步骤三:识别数字产业技术

专利本身判定:以每项专利的IPC主分类号与步骤一的匹配规则比对,判定该专利是否属于数字产业技术。

引用专利判定:以该专利引用的每条引用记录的引用IPC主分类号与匹配规则比对,判定每条引用是否属于数字产业技术。

步骤四:判定数实产业技术融合

融合条件(同时满足): 条件一:该专利IPC主分类号属于非数字产业技术(即实体产业技术) 条件二:该专利引用的专利中至少有一项引用IPC主分类号被识别为数字产业技术

去重逻辑:以专利公开号为唯一标识,确保同一项专利在同一企业-年份内不被重复统计。若一项专利存在多个申请主体,分别计入各申请主体当年的数实产业技术融合数量。

步骤五:汇总与指标计算

汇总层面:按股票代码 × 申请年份汇总满足融合条件的唯一专利公开号数量,得到数实产业技术融合次数。

指标计算:TechConv = ln(数实产业技术融合次数 + 1),加1处理零值,取对数缓解右偏分布。

面板补零

策略1:在每家企业的专利活跃年份范围内,对无融合行为的年份补零,对应代码Techconv_v1.py与结果数实产业技术融合_TechConv_v1.xlsx,观测值48647条

策略2:在整个样本区间2007-2024年内对无融合行为的年份补零,对应代码Techconv.py与结果数实产业技术融合_TechConv.xlsx,观测值84330条

论文中提及的两个稳健性替代指标 替代指标一:数实产业融合技术(FusiTech)

从创新产出视角测度:不依赖引用信息,而是看专利自身IPC分类号的构成。

判定条件:若专利IPC主分类属于实体产业技术,且该专利的其他IPC分类号中至少一项在任一层面被识别为数字产业技术,则定义为一项数实产业融合技术。 替代指标二:三年窗口期调整

目的:排除专利审查员添加的陈旧引用,仅保留发明人自主引用。

方法:仅统计在企业专利申请时所引用的前三年内公开的专利信息,重新计算数实产业技术融合数量。 【包括】

原始数据及计算结果

Python计算代码

附赠两个稳健性替代指标计算结果

顶部专栏分享更多内容

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值