2000-2024年上市公司产学研合作数据

 产学研合作(University-Industry Collaboration, UIC)是衡量企业与高校及科研机构协同创新程度的核心指标。本数据集基于中国上市公司年度报告中披露的客户及合作方清单构建,由团队依据公开披露信息测算,时间覆盖20002024年。核心指标包括股票代码、年份以及产学研合作强度(UIC)。指标计算公式为:UIC = ln(1 + 当年披露的产学研合作方数量)。其中,合作方定义为在年报客户清单或合作方章节中出现的、名称包含“大学”“学院”“学校”“研究院”“研究所”“科学院”“党校”“高校”“研究中心”等关键词的机构。每个不同的合作方(去重后)计为1次,取自然对数以缓解偏态分布问题。该指标取值通常介于0与3.5之间(部分企业因未披露客户信息或未与高校合作而取值为0),数值越大表示企业与学术机构的合作越活跃,能够有效刻画企业在特定年度的“产学研协同创新”程度,为研究开放式创新、知识溢出与技术转化提供基础数据。

基于本数据集,研究者可从三方面展开实证分析。第一,研究产学研合作对企业创新绩效的影响,将UIC与企业专利数、新产品产值等变量匹配,采用面板固定效应模型检验合作是否显著提升创新产出,并探索吸收能力、融资约束的调节作用。第二,分析产学研合作与政府补贴、知识溢出的互补效应,结合政府R&D补贴强度(SUB)和区域大学专利存量(KS),考察三螺旋(Triple Helix)框架下各要素的协同作用,即合作是否在补贴超过阈值(如营收的1.39%)时产生倍增效果。第三,进行异质性分析,按企业产权性质(国有/民营)、行业(制造业/服务业)、地区市场化程度分组,检验产学研合作效果的差异,为“精准施策”提供经验证据。

本数据集严格按照论文定义处理,所有处理通过Python(pandas、正则表达式)编程实现,确保可复现。首先进行数据提取与清洗:从上市公司年报PDF或txt文件中,定位“主要客户”“前五大客户”“合作伙伴”等章节,提取章节文本。其次识别合作方:对文本逐句扫描,使用正则表达式匹配包含机构后缀(如“大学”“研究院”等)的中文名称,并排除个人学历、项目名称等噪声(例如过滤包含“毕业”“博士”“存货”“在建开发产品”的句子)。然后统计去重:每家公司每年出现的不同合作方名称去重后计数。最后进行对数转换:计算ln(1+计数),得到产学研合作强度。若年报未披露客户清单或无合作方,则结果为0。输出Excel文件,包含股票代码、股票简称、年份、产学研合作识别次数、产学研合作标记、产学研合作对数转换值、具体合作关联词供后续分析使用。

数据指标

[图片]

数据展示

[图片]

参考文献

Wang, X., Zhou, B., Guan, W., & Dai, J. (2026). Triple Helix synergy at the subsidy threshold: Government support, IUR collaboration, and knowledge spillovers in enterprise AI innovation. Technological Forecasting & Social Change, *227*, 124626.

顶部专栏分享更多内容

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值