铜仁市论坛

首页 » 分类 » 分类 » 穿越数据的迷宫与六棱镜合伙人兼首席科学家
TUhjnbcbe - 2021/8/13 15:04:00
北京中医白癜风医院研究所 https://m-mip.39.net/nk/mipso_4686292.html

专利数据及大数据的使用已经遍布在各行各业,渗透进人们生活中的每个角落,在这背后,数据建设工作的重要性、复杂性却是公众不了解的。今天,六棱镜合伙人兼首席科学家武伟从专利制度的诞生、大数据实现商业变现维度出发,回答了关于数据的六大问题,讲述了六棱镜在两年数据建设过程中奋力拼搏出的各项成果以及对行业影响和意义等内容。

问1:如何理解大数据尤其是专利大数据的商业价值?

当前,科技复利正在加速产业周期迭代,经济社会运行面临高度的易变性(Volatility)、不确定性(Uncertainty)、复杂性(Complexity)和模糊性(Ambiguity),无论是国家、产业、组织还是个人,利用大数据决策成为经济社会穿越VUCA困境的普遍共识,数字化逐渐成为全球技术变革的核心方向。

对于大数据而言,“大”是形态,“数”是要素,“据”才是关键,据以致知,降低不确定性,解决信息不对称,提升决策价值才是大数据安身立命所在。而大数据产品就是要利用好信息不对称,加速和放大决策者在信息不对称中的收益。

智能时代,拥有数据不等于商业收益,大数据实现商业变现核心在于把握好四个关键。第一是应用场景。无论是降本增效、提质控险还是精细运营、精准施策,每个场景都有需要决策的核心问题,找准应用场景,大数据就找到了商业变现的出口。第二是融合增值。多源数据融合通过数据彼此之间的补充、校验和反馈,带来了单一数据价值密度的指数提升,这正是大数据相对于以往数据分析的竞争优势所在。数据融合增值能力是检验大数据公司技术能力的最显性手段。第三是专业协同。数据处理能力和行业专业知识缺一不可。决策本质上是认知,回答都是管理问题,核心是管理科学。大数据是工具,不能替代专业,两者有效协同不仅会提升认知水平,甚至会带来决策范式转变与使能创新。第四是在线计算。数据分析处理是数据融合价值释放的关键通道。正如王坚院士所讲,数据是资源,计算是动力,数据改变了商业本质,计算重塑经济未来。

专利制度的诞生和发展与人类的生产力和生产关系的变革有着密不可分的联系。随着生产力的发展,工业经济时代的到来,社会分工的细化,使得技术创新成果作为独特的商品参与交换,引发了产权制度的重大变革,由此诞生了专利制度,专利权成为申请人依法对其技术创新成果享有的财产权,它是一种有别于土地、厂房、机器等传统有形财产的无形财产权。按照契约理论,专利权是以国家面貌出现的社会与发明人之间签订的一项特殊契约。根据这种契约,发明人公开发明内容,国家则对发明人授予在一定期限内独占使用权利。一旦期限届满或者其他原因导致专利权终止,该发明就成为公共物,任何人都能无偿使用。专利制度有两大功能,一是保护,二是信息传播,利用好专利数据是一种有效应用专利制度的基本能力。

专利数据的主要优势有:一是专利数据是由法规规范的、连续的、标准化的;专利从撰写格式、结构、内容都由法律加以规范,世界各国专利法对此规定也基本相同。二是专利数据集技术、法律、经济信息于一体,关联了时间、空间、客体、主体等信息,是大数据时代实现数据关联整合的“HUB”。三是专利信息面广,覆盖所有技术领域,大到开创性发明,小到小改小革,记载了人类不同阶段的技术创新成果,记载了某一技术领域发展全过程,以及同一技术问题的不同解决方案。四是专利数据承载的技术内容新颖,公开迅速,连续不断。据统计,世界上90%-95%的技术创新成果首先在专利申请文件中出现。五是具有国际通用的著录数据识别代码和国际专利分类体系,并被世界各国广泛使用。六是提供同一专利的多语种文本(同族专利),语言兼容性强。

专利数据的不足之处有:一是并非所有的创新成果都申请专利。二是并非所有的专利都代表创新,专利价值呈现高度的偏态分布。三是很大部分专利并没有实际运用。四是因为延迟审查、司法独立等法制特点,专利文献重复量较大,专利数据的冗余度较高。五是专利文献文辞冗长、法文法语、文字晦涩、流程繁琐等特点,导致应用壁垒极高。六是专利数据官方公布周期一般以周为单位,再加上从申请到公开的时间,使得专利数据是个“慢变量”,很难像新闻舆情一样反映及时信息。七是专利数据仅提供了链接其他数据的入口,但是并没有提供对应的数据信息,单从专利数据本身分析仍存在信息维度不足的问题,甚至会出现以偏概全、信息失真现象。

当前,“逆全球化”背景下我国产业链创新链深度融合迫切需要打通科创数据孤岛,科创大数据作为新型创新基础设施在产业发展和创新投资中的地位愈发重要。在客观认识专利数据特点的基础上,需要充分发挥专利数据优势,尤其是专利分类、事务状态、同族机制、权利范围等相对于其他科技数据的差异特点,充分发挥专利数据独有的多入口信息链接优势,以专利数据作为核心和索引,深度融会贯通工商注册、投资并购、技术标准、科研项目、企业名录、人才履历等多维数据资源,构建科创产业数字基础设施。

问2:六棱镜按照什么路径推进大数据建设?

六棱镜技术和数据迭代路径是对行业长期观察思考实践的战略选择。“从数据融合、到内容生产、再到智能分发”的技术三步走对应支撑了六棱镜产品业务体系的部署经营,而数据“从可及、到互联、再到融合”的三阶大数据“版本”则是六棱镜数据资源配合技术迭代和业务经营的演进路径。具体而言,以“数据可及”为目标的大数据1.0,关键措施是数据供应链建立、数据资源采集等源头保障和统一存储架构等大数据基础设施搭建,“块”状数据仓库在物理上集聚,确保随时可用。以“数据互联”为目标的大数据2.0,关键措施是通过多维标签标引、分类映射关联、主数据消歧对齐等实现数据互联互通,数据资源之间发生了“链式聚合”,彻底消除数据孤岛,典型成果就是支撑专利画像的国内外专利全生命周期数据库、支撑企业画像和人才画像的科创身份卡数据库。以“数据融合”为目标的大数据3.0,关键措施是通过实体识别、关系抽取等手段构建行业知识图谱,并配合进行图数据库等载体升级,“网状”数据强耦合集成的“核反应”将极大提高语义智能,典型成果就是六棱镜全球科技竞合知识图谱数据库,这是科创产业要素物理世界的数字孪生,是科创生态搜索匹配、智能推荐、自动分发、决策支撑等应用的智能基石。

问3:六棱镜采取什么措施确保数据战略落地?

数据资源建设是系统工程,涵盖了“人、机、料、法、环”等管理要素。按照大数据推进路径,我们搭建了一支数据科学团队并持续优化团队结构,按照产品和业务需求,建立了涵盖数据采集采购、解析清洗、加工标引、关联集成、统一接口、系统应用、可视化呈现等全周期的数据流程,清晰确定了团队职责与岗位分工,明确了每个人工作的“界面”和交互的“窗口”,搭建了兼顾大数据计算处理和小数据加工分析的软硬件基础设施,制定了系列涵盖元数据标准、数据加工规程、标签体系标准、指标指数标准、数据大屏实施标准、数据质量控制标准等业务规则,出台了数据资源管理、安全合规管理、数据统计交付等制度规范,由此形成了立足数据生命周期管理的数据治理体系,并获得ISO质量管理体系、信息安全管理体系、环境管理体系以及OHSAS职业健康安全管理体系认证。对标国际数据管理协会(DAMA)相关标准,六棱镜数据管理能力成熟度持续提高,为六棱镜产品、平台以及项目实施提供有力保障。

问4:六棱镜数据建设取得哪些成果,对集团业务起到什么作用,对行业发展有什么影响?

六棱镜始终坚持将关联融合作为数据增值核心,不断构筑数据核心竞争优势。从直接成果来看,形成了系列数据库产品,包括:实现“一号通”关联整合的全球专利全生命周期数据库,立足国家标准并根据产业创新热点实时升级的战略性新兴产业专利数据库、国民经济行业专利数据库,囊括人工智能、物联网、5G、自动驾驶、区块链、生命健康、智能制造、新能源汽车、集成电路等重点产业的产业链专利数据库,覆盖全球主要标准组织的全球标准必要专利数据库,精细加工知识产权裁判文书形成的专利诉讼数据库,全面刻画科创画像的企业身份卡、工程师身份卡、资本身份卡数据库、硬科技评价指标数据库,以资本、技术、人才商业竞合关系为网络路径的全球科技竞合知识图谱数据库等。

这些数据库资源已经商业应用在SIXLENS全球专利投融资情报系统、LINKINIP全球产业科技发现与科创服务平台,以及六棱镜承建的北京、上海、深圳、南京、潍坊、长沙等城市20余个平台系统中。自今年4.26在滨江发布全国产业知识产权运营数据中台战略后,六棱镜打造的产业科创数字基础设施的乘法效应加速显现。每天真实运行的数据流服务网络表明,六棱镜已经成为全国知识产权行业事实上的数据中台。

从业务赋能来看,大数据建设过程,也是六棱镜数据驱动的综合业务体系形成过程。所谓数据驱动赋能,源于改变效率,改变成本结构,就是降本增效。例如,以产业专利导航分析为例,数据团队用不到20%的投入解决了占项目任务80%的数据处理统计等工作,让专业人员聚焦于数据分析和结论挖掘,大幅缩短产业专利导航实施周期,同时持续提升成果价值密度。又例如,以面向专利保险评审的投保专利体检为例,基于六棱镜大数据的建模与程序开发,我们在一周内批量出具上千件专利的定制化专利体检报告,使得规模化开展知识产权金融业务成为可能。两年内,六棱镜数据驱动的业务体系不断进化,具有良性互动、自我循环、自生进化的生态特征,而这正是六棱镜体系核心竞争优势所在。

从行业变革来看,知识产权尤其是专利是科技企业最为有形的无形资产。六棱镜的使命愿景就是让科技企业知识产权价值显性化,让细分行业领域创新型企业和隐形冠军脱颖而出,获得资本加持和金融支持进而加速发展,助力企业从IP到IPO。正是基于SIXLENS、LINKINIP等大数据产品,越来越多的科创企业和人才团队被产业资本、金融机构等赋能方快速发现,生动呈现了“数据驱动资本,资本聚力创新”产业升级态势。

问5:六棱镜数据建设开展了哪些研发创新活动?

六棱镜致力于大数据的起因在于现实业务存在迫切需要,整个行业存在明显痛点,但缺少高质量供给,没有可用的数据产品。其实,从知识产权大数据行业来看,大家不是不想做,而是难度太大,需要大量资源资金的持续投入,至于研发创新能否成功却是个未知数。解决问题需要勇气和耐心。

六棱镜从成立之初到现在,集团创始团队始终坚持研究创新,逐项攻克行业痛点。例如,我们率先实现了专利“一号通”整合全生命周期数据。率先实现面向“资源、机构、人”三类主体,以专利数据关联融合工商登记、金融资本、科学文献、技术标准、人才团队、研发项目等多源数据,彻底打通了专利与其背后的企业、人才以及投资企业人才团队的资本之间的数据路径。通过文献调研和实际测算,类似神农尝百草的方式,我们几乎遍历了全球学术文献中公开的所有专利指标,掌握了哪些指标在中国真正具有现实指导意义。我们持续坚持产业经济学和创新经济学研究,极大丰富了基于专利信号的硬科技投资理论,创造性提出了ICEE(创新力、竞争力、进化力、影响力)硬科技评级指数、基于信贷视角的专利价值评估指标体系等研究成果,广泛应用于深交所科技大数据系统、银行知识产权质押融资等金融场景中。

此外,六棱镜承担了专利密集型产品标准制定、标准必要专利许可政策、高校沉睡专利运营、产业投资专利导航、资本市场知识产权调查等国家知识产权局专项,深度参与了国家自然基金重大专项“宏观大数据建模和预测研究”、科技部创新方法专项“科技成果信息知识图谱和创新服务研究与应用示范”等重大项目。作为国家知识产权大数据产业应用研究基地,六棱镜在知识产权数据科学、科创指标评级评价、产业专利导航分析建模等方面逐渐成为理论创新高地。

问6:六棱镜数据团队具备什么素养?如何培养知识产权数据团队?

数据科学团队一定是具备数据素养、专业素养和商业素养的复合团队。数据素养是指具有数据意识,具有统计思维,能够运用IT技术手段实现数据清洗加工处理集成等实操工作。专业素养是指要掌握数据资源在业务层面的底层逻辑,必须清晰知道数据“从哪来、到哪去”,还要知道数据是“怎么来、怎么去”。对应到知识产权数据,意味着必须掌握知识产权法律规则、业务流程、编码体系、分类体系、数据规范等专业知识。商业素养是指数据科学团队以服务商业价值为根本导向,数据标准和加工程度紧密围绕应用场景展开,要能听懂商业话术进而转化为业务需求和执行路径。

按照这些要求,打造一支合格的数据团队很难,尤其是知识产权数据团队更是难上加难。主要原因是知识产权数字化人才极其稀缺。知识产权尤其是专利集成了技术法律经济等信息,本身专业壁垒极高。具有知识产权数据能力,意味着在知识产权专业基础上进一步叠加数据技能,导致这个群体很小众。如果说要进一步具备知识产权数据规则研究能力、数据产品标准制定能力、信息系统设计管理能力、生产加工调度组织能力、全面质量管理能力、人员团队搭建培养能力,操作过千万量级数据,并且具有利用知识产权数据服务政府、企业等不同场景、输出平台项目、报表报告等不同载体的实践应用经验,粗略估计,这样的超级复合体在国内不超过10个人。需要纠正的是,行业有个误区,以为审查员等经常使用专利数据的人必然是数据专家,其实不然。“用数据”和“做数据”是两种不同的业务路径,各自有针对性的业务逻辑。

我们经过不懈努力和倾心投入,打造了一支复合型、全角色、结构化、梯度式的数据科学团队。这是一支在超级复合个体上的多元复合团队。我们一方面持续网罗知识产权数据精英和技术人才,另一方面六棱镜实践摸索出的数据人才培养体系进行专门培养,用百万级别起步的数据进行技能磨练,用服务政府、企业、资本、银行等多场景下真实业务需求带动专业提升,使得这支团队在实践中百炼成钢!

如果说解决业务问题的“专业”是六棱镜数据团队的硬技能,那么质量至上、久久为功、耐得住寂寞、对得起职业的“敬业”则是六棱镜数据团队的软实力。数据工作枯燥,往复循环,没有最好,只有更好,能够沉下心来,持之以恒的把简单的事情做到极致,在当下显得尤其弥足珍贵。而团结合作、善于沟通、互帮互助的文化氛围则是确保数据中台真正落地、数据驱动的业务体系得以有效运转的重要保障。数据团队的成熟需要时间沉淀,没有捷径可走。六棱镜走在了行业前面。

个人简介

武伟,六棱镜集团合伙人,首席科学家兼研究院院长,中国汽车产业知识产权投资运营中心副总经理,中国知识产权信息联盟副理事长,中国科学技术指标研究会理事,湖北工业大学经管学院兼职教授,首都知识产权服务业协会标准化委员,副研究员,国家知识产权局高层次人才、全国知识产权骨干人才、全国专利信息师资人才、北京市海英人才,北京、杭州、长沙市等知识产权专家库专家,原中国专利技术开发公司副主任、国家专利导航企业项目研究与推广中心副总经理,长期从事知识产权大数据挖掘开发及统计分析等工作。

◆六棱镜CTO李杨聊六棱镜背后的技术积淀

◆六棱镜合伙人雷和平谈产业创新图谱分析的理念与方法

◆六棱镜COO刘洋谈数据驱动的知识产权咨询服务

◆六棱镜合伙人兼数据资源中心总经理张姝娜谈知识产权数据价值显性化

◆六棱镜合伙人兼数据咨询总监陈洁聊从微观分析到宏观研究的转型

◆六棱镜合伙人兼渠道运营中心总经理马妍谈以思维创新带动业务联动增长

商务合作IPO辅导I刘 洋数据业务I雷和平产品服务丨张会龙公共事务I马 妍转发,点赞,在看,都是真爱预览时标签不可点收录于话题#个上一篇下一篇
1
查看完整版本: 穿越数据的迷宫与六棱镜合伙人兼首席科学家