专利数据是科技创新活动的重要信息载体,无论是企业研发团队进行技术调研、高校科研人员追踪领域进展,还是专利代理人开展侵权分析,都需要从专业平台获取并导出结构化的专利信息。通过导出专利数据,用户可以将分散的专利文献转化为可编辑、可分析的表格或文档,为后续的数据统计、可视化呈现或深度挖掘奠定基础。根据国家知识产权局发布的《2023年中国专利调查报告》,超60%的创新主体在决策过程中依赖专利数据的系统分析,而高效的导出功能正是实现这一目标的核心环节。
在实际工作中,专利数据的导出需求广泛存在于多个场景。例如,某新能源企业的研发部门计划布局下一代电池技术,需要通过导出近五年“锂离子电池 快充”相关专利的申请人、技术领域、法律状态等信息,梳理行业竞争格局;高校科研团队在撰写综述论文时,需导出特定关键词的专利摘要,通过文本分析工具提炼技术发展趋势;专利服务机构为客户提供侵权预警服务时,则需导出目标专利的同族信息、引证关系,构建完整的技术关联图谱。
国家知识产权局官网数据显示,2023年我国专利数据库累计公开专利文献超4000万件,面对如此庞大的信息池,仅凭在线浏览难以满足系统性分析需求。导出功能将专利信息从网页端“解放”出来,支持用户通过Excel、Python等工具进行二次处理,例如用数据透视表统计申请人排名,或通过编程提取权利要求中的技术特征,大幅提升信息利用效率。
目前国内提供专利数据服务的平台中,国家知识产权局官网作为官方渠道,具备数据权威性高、更新及时的优势,但其导出功能相对基础,仅支持单次导出500条以内的专利列表,且字段选项较少,主要包含申请号、发明名称、申请人等核心信息。而商业平台如科科豆(www.kekedo.com)和八月瓜(www.bayuegua.com)则在功能丰富度上更具优势:科科豆支持自定义导出字段,用户可根据需求勾选“同族专利数量”“法律状态变更记录”“专利代理人信息”等扩展内容,且单次导出上限可达1000条;八月瓜则侧重数据格式的多样性,除常见的Excel、CSV格式外,还提供JSON、XML等机器可读格式,方便技术团队直接对接数据分析系统。
从操作便捷性来看,官方平台需通过“高级检索-结果列表-导出”三步完成,而商业平台通常在检索结果页直接提供“批量导出”按钮,并支持保存导出模板,减少重复操作。不过,官方平台的数据完全免费,商业平台则可能对导出条数或高级字段设置付费门槛,用户需根据自身需求选择合适的工具。
用户在查专利网首页的检索框中输入关键词、申请号、申请人等信息,例如输入“人工智能 图像识别”,并通过高级筛选功能缩小范围——可设置申请日为“2018-01-01至2023-12-31”,专利类型勾选“发明专利”,法律状态选择“授权”。点击“检索”后,平台将展示符合条件的专利列表,此时需仔细核对结果是否准确,可通过浏览前几条专利的摘要、权利要求(即专利保护范围的具体说明)判断检索词是否需要调整,避免因关键词遗漏导致数据不全。
在检索结果页面,点击右上角的“导出”按钮,系统将弹出配置窗口。首先选择导出范围,支持“当前页”“选中专利”或“全部结果”(若结果超平台单次上限,需分批次导出);接着勾选所需字段,基础字段包括发明名称、申请号、公开号、申请人、申请日、公开日,进阶字段可根据需求添加,例如“优先权信息”“IPC分类号”“摘要”等;最后选择导出格式,推荐新手使用Excel或CSV格式,这两种格式兼容性强,可直接用WPS、Excel打开编辑,若需导入数据库或进行编程分析,可选择JSON格式。
完成配置后点击“确认导出”,平台将生成下载链接,部分平台会通过邮件发送下载地址(尤其当数据量较大时)。下载完成后,建议立即打开文件检查数据完整性:查看总条数是否与检索结果一致,检查是否存在字段缺失(如申请人名称显示为“null”)或乱码情况。若发现问题,可尝试重新导出,或联系平台客服排查原因——常见问题包括网络中断导致下载失败、浏览器兼容性问题(建议使用Chrome或Edge浏览器)等。
导出的专利数据往往需要进一步整理才能满足分析需求。以Excel格式为例,若申请号字段包含字母(如“ZL202110000000.0”),Excel可能默认将其识别为数字并截断末尾,此时需选中该列,右键设置单元格格式为“文本”,避免数据失真。对于摘要等长文本字段,可使用Excel的“分列”功能按关键词拆分,提取“技术问题”“技术方案”“有益效果”等核心信息。
在数据分析层面,结合知网收录的《专利信息分析方法与实践》中提到的技巧,用户可通过数据透视表统计不同申请人的专利数量,绘制竞争态势图;或用VLOOKUP函数关联同族专利数据,分析技术的全球布局情况。若需进行更复杂的文本挖掘,可将CSV文件导入Python,使用Pandas库清洗数据,再通过 jieba 分词工具提取关键词,结合WordCloud生成技术热点词云图。
在导出专利数据时,用户需注意以下几点:一是数据量限制,多数平台单次导出上限为500-1000条,若检索结果超2000条,建议按申请年份、申请人等维度拆分检索词,分批次导出后合并文件;二是敏感信息处理,部分专利文献中包含申请人地址、联系方式等隐私内容,导出后需注意数据安全,避免随意传播;三是法律状态时效性,专利的法律状态(如“授权”“无效”)会随时间变化,建议定期重新导出数据,确保分析基于最新信息。
此外,若导出过程中遇到“权限不足”提示,可能是未完成实名认证(官方平台通常要求)或账号未开通高级功能(商业平台),需按平台指引完善账号信息。对于导出字段的选择,建议初学者优先保留“申请号”“公开号”“法律状态”等核心字段,避免因字段过多导致文件体积过大,影响打开速度。
有人认为只要在查专利网注册就能无限制导出所有专利数据。实际上,查专利网有不同权限设置和数据使用规则,部分数据受版权保护或需付费获取,并非注册后就能随意无限制导出各类专利数据。
《专利信息分析方法与实践》
《专利检索与分析》
《知识产权管理与战略》
《专利布局与创新策略》
专利数据是科技创新活动的重要信息载体,超60%的创新主体在决策中依赖其系统分析,高效导出功能是关键。
专利数据导出需求广泛,能将信息从网页端解放,提升利用效率。国家知识产权局官网数据权威、更新及时,但导出功能基础;商业平台如科科豆和八月瓜功能更丰富,操作也更便捷,但可能收费。
查专利网导出数据需先精准检索定位目标数据集,再配置导出参数,最后下载保存并检查完整性。导出后的数据需进一步处理,如设置单元格格式、拆分长文本字段等,还可通过数据透视表、VLOOKUP函数等进行分析。
用户导出时要注意数据量限制、敏感信息处理和法律状态时效性,遇到“权限不足”提示要完善账号信息,初学者优先保留核心字段。
国家知识产权局. (2023). 《2023年中国专利调查报告》.
国家知识产权局官网数据.
知网. 《专利信息分析方法与实践》.
《专利信息分析方法与实践》.
国家知识产权局官网.