Press "Enter" to skip to content

【交易技术前沿】专利价值智能评估方法研究

本文选自《交易技术前沿》总第四十三期文章(2021年3月)

 

李一鸣、张娟、余勇、钟鹏翔/上交所技术有限责任公司

 

专利是企业重要的无形资产,建立有效的价值评估体系,对企业自身发展具有十分重要的意义。我部深耕监管科技领域多年,在企业科技评价方向略有拙见,于2020年本刊发表文章《智能科技评价体系研究之专利维度》一篇,该文详细阐述了企业智能科技评价的整体思路和实施路径。在此基础上,我部从微观的角度,研究专利的评价方法,进一步深挖细节,优化算法。本文尝试建立一套专利分析指标体系(以下简称“指标体系”),希望能够从宏观与微观层面涵盖专利在技术、法律、市场三个维度上的质量与价值,并以该指标体系为指导,使用大数据分析和机器学习决策树算法,实现对专利价值高效、准确的评估。

 

1.引言

 

优质的专利对于企业的发展具有战略性意义。建立合理高效的指标体系,不仅有利于企业确定主攻方向,及时优化调整产业结构,也是企业长足发展的基石。同时,也为企业实现专利资本化提供价值参考,促进企业对专利的有效利用。由此可见,专利价值评估对企业而言意义重大。

 

2020年证监会第21号文件《科创属性评价指引》对科创企业的专利指标提出了很高的要求,在科创板审核过程中对专利的重视程度也可见一斑。但每个发行人的专利多则数千篇少则也有几十上百篇,如何快速识别发行人专利的质量,已成为科创板审核过程中一项亟待解决的问题。

 

目前对专利价值评估大都沿用无形资产的评估方法,如成本法、市场法、收益法。成本法是以实际研发成本的现值或者重置成本减去损耗和贬值作为评估值的方法。但由于专利的价值主要不是根据研发成本而定,而是取决于它给企业带来的预期垄断利益。因此,用成本法评估的价值往往偏低。市场法是参照类似资本的市场价格进行评估。由于每个专利的个性特征十分显着,一般不具有可比性,市场法显然有其局限性。收益法是评估无形财产经常用到的一种方法,即将评估对象的预期收益适当折现。但是所需参数——经济寿命周期、利润分成率、折现率仍需要估算,如果估算不准确,用收益法计算的结果依然不可行 [1] 。

 

2.解决方案

 

作者通过研究和分析了大量的国内外文献和书籍等资料,走访专利代理、券商投行、资产评估等相关领域专家,并对大量专利样本进行分析,最终建立一套能够从宏观与微观层面涵盖专利在法律、技术、经济三个维度上的质量与价值的指标体系,并以该指标体系为指导,使用大数据分析和机器学习决策树算法,实现对专利价值高效、准确的评估。

 

3.指标体系的构建

 

3.1.构建标准

 

指标体系是指一套具有内在联系、起互补作用的指标群体,同时能够反映专利价值的总体特征,体现专利在交易中的内在价值。一个合理、完善的指标体系,是分析专利价值的先决条件。建立指标体系主要有以下6大原则 [2] ∶

 

(1)全面性原则。指标体系应能反映专利价值的内在本质,应能综合各方面目标与价值的共性特点,反映出该专利在交易中所涉及的各方面因素的客观差别。

 

(2)系统性原则。专利价值的分析过程是一个完整的系统工程,指标体系应能全面地反映该专利在交易过程中可能涉及的各方面因素。专利本身的法律、技术、市场的价值,都应全面、客观地加以考察。

 

(3)可操作性原则。指标体系中的指标含义必须明确、有利于进行分析与打分,从而是可操作的,并具有横向可比性。

 

(4)独立性原则。在建立指标体系的过程中,尽力减少各个指标之间的耦合度,避免显而易见的包含关系。相关联的指标尽可能选择其中一个指标来说明专利价值分析的某个方面,对隐含的相关关系,要设法以适当的方法予以消除。

 

(5)层次性原则。层次性是指指标体系结构自身的多重性,即一个指标可以由若干个子指标所决定,从而构成树形结构,这将为衡量专利在各个方面的价值带来方便。

 

3.2.详细架构

 

基于上述六项原则,本文将指标体系设计为双层架构,第一层,将指标分为技术、法律、市场三个维度;第二层,将第一层指标分别分解为若干项支撑子指标。

3.2.1.技术价值

 

技术价值是从技术的维度来评价一项专利的价值,是决定专利价值的重要因素。本文将技术价值维度细分为8个支撑指标,分别为:创新程度、生命周期、技术宽度、技术迭代、后向引用、权利人属性、舆情焦点和特征数量。

 

(1)创新程度

 

创新程度是指一项专利的技术与本领域的其他技术相比是否具有创新性,即该技术相较于现有技术是否具有突出的实质性特点和显着的进步。
通过语义算法,检索申请日前后与当前分析专利相似度较高的其他专利,申请日之前相似的专利越少,之后越多,其创新程度越高。计算前后相似专利数量的比值,作为创新程度指标。

 

(2)生命周期

 

生命周期是指一项技术的发展趋势。通常,一项技术会经历萌芽期、发展期、成熟期以及衰退期,不同生命阶段所产生的专利价值不同,如萌芽期多为核心基础性专利,而衰退期专利价值普遍较低。
使用当前分析专利的国际专利分类大组的专利数量与时间进行线性拟合建模,确定专利技术的生命阶段。

 

(3)技术宽度

 

技术宽度是指当前专利所涉及到的技术领域的数量。如今,单一学科已很难取得实质性突破,往往需要多学科交叉。将国际专利分类的大组作为最小原子,对专利的技术方向进行拆分,作为技术宽度指标。

 

(4)技术迭代

 

技术迭代是指技术迭代所花费的时间长短。通常,越有价值的技术,其研发投入越大,相应的迭代速度更快,研发时间越短。
对当前专利、引用专利和被引专利三类专利申请日的差值进行绝对值求平均,作为技术迭代指标。

 

(5)后向引用

 

后向引用是指在说明书中引用当前分析专利的其他专利数量。后向引用反映了当前专利对后续技术研究的影响,根据大数据分析,专利的每一个额外的引用会给权利人(企业)带来3%市场价值的增长 [3] 。后向引用指标是专利技术先进性的重要表征。

 

(6)权利人属性

 

专利的技术价值,归根结底是发明人(权利人)技术水平的体现。使用该专利权利人的专利数量、授权比,作为权利人属性指标。

 

(7)舆情焦点

 

通过分析专利技术的舆情数据,计算得出专利技术的舆情热度,作为舆情焦点指标。舆情热度越高,说明该技术正处在时代的风口,代表技术具有较高的先进性和创新性。

 

(8)特征数量

 

权利要求分为独立权利要求和从属权利要求,独立权利要求从整体上反映出发明或实用新型的主要技术内容,包括全部的必要技术特征。特征数量少表示专利处于相对空白的领域,先进性较高,能够圈定较大的保护范围,可以引领技术的发展。

 

3.2.2.法律价值

 

法律价值是指从法律稳定性的角度来评价一项专利的价值。稳定性是一项被授权的专利在行使权力的过程中被无效的可能性大小。据统计,被提起无效的专利有50%的可能性被全部或部分无效 [5] 。本文将法律价值维度细分为6个支撑指标,分别为:风险规模、无效宣告、专利类型、法律状态、权利要求和有效期限。

 

(1)风险规模

 

在竞争对手提起无效时,会提交公开日早于当前专利公开日的其他专利作为对比文件即无效证据。当前专利与对比文件相似度越高,被无效的可能性越高。因此公开日早于当前专利的其他相似专利越多,则该专利的法律稳定性越低。
通过语义算法,统计公开日早于当前分析专利且相似较高的其他专利,作为潜在风险规模特征指标。

 

(2)无效宣告

 

无效宣告是指经历过无效程序后专利的法律状态。根据上述我们可知,被提起无效的专利有50%的可能性被全部或部分无效。因此,经过无效程序仍维持有效的专利,其具有非常高的法律稳定性。

 

(3)专利类型

 

根据《专利法》规定,实用新型、外观设计专利仅需通过初步审查即可授权,而发明专利除初审外还需通过详细的实质审查才能被授权。因此,发明专利相较于实用新型和外观设计,具有更严格的审查流程和更稳定的法律价值。

 

(4)法律状态

 

专利分为公开、实审、有效、失效、驳回等法律状态,不同状态下的专利其法律稳定性是不同的。

 

(5)权利要求

 

权利要求是专利文件中对要求保护内容的限定说明,用来确定专利的保护范围,具有直接的法律效力。通过研究《审查指南》我们发现,权项数越多,保护相对越全面,法律稳定性越高。使用权项数作为权利要求指标。

 

(6)有效期限

 

有效期限是指基于一项授权的专利从其授权之日起受法律保护的时间长度。法律保护专利的时间是有限制的,发明专利最多不超过20年,实用新型和外观设计专利最多不超过10年,因此有效期限的长短会影响到专利的法律价值,显然剩余期限越长,则其法律价值越大。

 

3.2.3.市场价值

 

市场价值是市场对专利技术的认可程度。本文将市场价值维度细分为8个支撑指标,分别为:研发跟进、市场规模、全球布局、实施许可、权利转让、质押、诉讼和复审。

 

(1)研发跟进

 

通过语义算法,统计申请日后与当前分析专利相似度较高的其他专利的权利人(发明人)主体数量,作为研发跟进指标,确定跟进研发情况。从事相关研究的主体越多,说明市场对该技术的认可度越高,具有越高的市场价值。

 

(2)市场规模

 

通过统计该技术领域(国际专利分类号的大组)专利的数量,作为市场规模指标。数量越多,说明行业对该专利技术价值越认可,才会投入更多的资源,因此产出了更多的专利。

 

(3)全球布局

 

全球布局是指该专利在除本国之外的其他国家申请专利的数量。专利的申请、审核等需要缴费,每年还需要缴纳年费。以中国为例,一项发明专利维持20年,仅基本花费就需要10万余元。因此,全球布局数量越多,说明权利人对该专利的重视程度越高,该专利能产生的经济价值越大。

 

(4)实施许可

 

实施许可是指专利权人将专利许可给他人使用的行为。根据《专利实施许可合同备案办法》规定专利许可是一种市场行为,通常是比较重要、真正能为使用者带来经济效益的专利才会出现许可的情况。因此,存在许可行为是专利市场价值重要的体现。

 

(5)权利转让

 

权利转让是指专利权人将专利权转让他人的行为。专利许可是一种市场行为,产生经济效益,通常是比较重要、真正能为使用者带来经济效益的专利才会出现转让的情况。因此,转让行为是专利市场价值重要的体现。

 

(6)质押

 

质押是指专利权人将拥有的专利权担保其债务的履行,当专利权人不履行债务的情况下,债权人有权把折价、拍卖或者变卖该专利权所得的价款优先受偿的物权担保行为。专利质押是将无形资产变现的一个行为,只有比较重要、真正能产生经济效益的专利才允许并产生质押行为。因此,存在质押行为是专利市场价值重要的体现。

 

(7)诉讼

 

诉讼是指因假冒专利、专利侵权等事件依照《中华人民共和国民事诉讼法》向人民法院提起的诉讼。诉讼往往会花费大量人力物力,只有比较重要、真正能产生经济效益的专利才值得使用法律手段。因此,存在诉讼情形是专利市场价值重要的体现。

 

(8)复审

 

复审是指专利申请被驳回时,申请人可以在接到驳回通知3个月内向国家知识产权局专利复审委员会提出复审请求。复审流程复杂且需要缴纳一定额度的复审审查费,只有比较重要、真正能产生经济效益的专利才值得使用复审程序。因此,存在复审情形且最终被授权是专利市场价值重要的体现。

 

4.价值计算

 

基于第3章中构建的专利评价指标,本文通过机器学习决策树模型对专利价值进行定量的计算。

 

4.1.模型构建

 

4.1.1.特征的扩充

 

为了提高机器学习模型的拟合度,在第3章构建的专利评价指标的基础上,对其进行特征的扩充。使用不同转化因子,将专利的固有属性进行非线性扩维操作,构建特征集:

4.1.2.训练集的选取

 

选择近年来,获得国家知识产权局评定的中国专利金奖、银奖、优秀奖的专利,被国家知识产权局驳回的专利和在数据库中随机抽取的专利作为样本,经专家打分标注作为训练集合:

4.1.3.决策树的构建

 

决策树模型为一种树形结构,包括一个根结点、若干个中间结点和叶子结点。叶子结点为最终的决策结果,即专利的价值评价结果;中间结点和根结点对应一类特征。

 

根结点和中间结点对应特征的选择是影响决策树模型准确率和召回率的关键所在。一个好的决策树模型,数据集随着结点的层层划分,结点的“纯度”越来越高,即结点所包含的样本尽可能属于同一类别。

本文采用基尼指数(Giniindex)来选择最优划分特征。假定当前训练D中第k类样本所占的比例为

,则训练集D的纯度可以用基尼值来度量:

Gini(D)的数学含义是从训练集D中随机抽取两个样本,两个样本类别不一样的概率值。因此,Gini(D)越小,则数据集D的纯度越高。

 

假定使用特征c来对样本集进行划分,若离散特征c有V个可能的取值{c 1 ,c 2 ,…,c v },则会产生V个分支结点,其中第v个分支结点包含了数据集D中所有在特征c上取值为c v 的样本,记作D v ,根据上述公式计算得出D v 的基尼值。同时考虑到分支结点所包含的样本数越多,其影响越大,因此根据不同的分支结点所包含的样本数不同,给分支结点赋予权重。于是可以计算得出使用特征c对样本集D进行划分所获得的基尼指数:

基于此,在候选特征集合C中,我们选择那个使得划分后基尼指数最小的特征作为最优划分特征,即

4.1.4.连续值的处理

 

如后向引用、权利要求等特征的可取值不再有限,因此,不能直接根据连续属性的可能值来对结点进行划分。本文采用bi-part方法对连续特征进行处理。

 

对于连续特征c,假定c在训练集D上出现了n个不同的取值,将这些值按照从小到大的顺序进行排列,记作{c 1 ,c 2 ,…,c n }。基于划分点t可将D分为子集和,其中在特征c上取值小于或等于t的样本属于,在特征c上取值大于t的样本属于。显然,对相邻的属性取值c i 与c i+1 来说,在区间[a i ,a i+1 )中取任意值所产生的划分结果相同。因此,对连续特征c,本文考察包含n-1个元素的候选划分点集合:

即把区间[a i ,a i+1 )的中位点作为候选划分点。然后,我们就可以像处理离散特征一样来考察这些划分点,选择最优的划分点,即使基尼指数最小划分点进行样本集合的划分。

4.2.模型调整

 

基于上述方法,我们最终将会得到一棵决策树。但是,在决策树训练过程中,为了尽可能地将所有的训练样本正确分类,有时会造成决策树深度过深、分支过多。这是因为模型把训练集自身的一些特点当作所有数据都具有的一般性质而导致的过拟合。因此,通过主动去掉一些分支来降低过拟合的风险。

 

决策树剪枝的基本策略有预剪枝和后剪枝。

 

4.2.1.预剪枝

 

在决策树生成过程中,在划分前先对每个结点进行估计,若当前结点的划分不能带来决策树泛化性能性能提升,则停止划分并将当前结点标记为叶结点。
预剪枝使得决策树的很多分支都没有“展开”,这不仅降低了过拟合的风险,还显着减少了决策树的训练时间开销和测试时间开销。但另一方面,有些分支的当前划分虽不能提升泛化性能、甚至可能导致泛化性能暂时下降,但在其基础上进行的后续划分却有可能导致性能显着提高;预剪枝基于“贪心”本质禁止这些分支展开,给预剪枝决策树带来了欠拟合的风险。

 

4.2.2.后剪枝

 

先根据训练集生成一棵完整的决策树,然后自底向上地对非叶结点进行考察,若将该结点对应的子树替换为叶结点能带来决策树泛化性能提升,则将该子树替换为叶结点。

 

后剪枝决策树通常比预剪枝决策树保留了更多的分支。一般情形下,后剪枝决策树的欠拟合风险很小,泛化性能往往优于预剪枝决策树。但后剪枝过程是在生成完全决策树之后进行的,并且要自底向上地对树中的所有非叶结点进行逐一考察,因此其训练时间开销比未剪枝决策树和预剪枝决策树都要大得多。

 

判断决策树通过剪枝后泛化性能是否提升,本文采用留出法,即预留一部分数据作为“验证集”以进行性能评估。

 

4.3.模型修正

 

根据专利数据的业务特性,对机器学习算法预测的结果进行适当的修正,设计了如下3条修正规则:

 

4.3.1.保护期限因素

 

专利的保护期是有时间限制的,发明专利保护期限为20年,实用新型和外观设计专利保护期限为10年。超过期限,专利技术即不再受法律的保护。因此,根据专利已生效的时间,调整专利价值。

其中:

 

v:专利价值;

 

n:专利已生效年限;

 

∂:专利类型调节参数,发明专利取值40,实用新型和外观设计取值20;

 

w ey :专利生效年限这个特征在决策树的权重,根据基尼系数计算得出;

 

W:专利全部特征权重的总和。

 

4.3.2.权利人因素

 

一些大公司的专利量非常多,如华为的专利数量高达数万篇。这种情况下就会导致专利申请人(权利)专利转移质押数量占比较小,对这种情况做如下调整:

其中:

 

v:专利价值;

 

n:权利人专利数量;

 

n mean :中国境内全部专利权利人专利数量的平均数;

 

w rh :专利权利人这个特征在决策树的权重,根据基尼系数计算得出;

 

W:专利全部特征权重的总和。

 

4.3.3.专利类型因素

 

针对专利类型进行了调整,不同类型的专利其授权难易程度不同。以发明专利为例,其授权要经历初步审查和实质审查,并严格要求新颖性、创造性和实用性,相较于实用新型和外观设计专利,具有更高的技术价值;同时,根据《专利法》规定,外观设计专利可不经过保密审查即可向境外进行转让或授权,外观设计专利的价值相较其余两类最低。因此,在上述价值的基础上对三类专利进行调整:

 

其中:

 

v:专利价值;

 

β:专利类型调节参数,发明专利β取值1.2,实用新型取1,外观设计取值0.8;

 

最终,基于机器学习模型再辅以修正规则,最终得出专利的价值度。

 

5.验证

 

5.1.微观验证

 

选择近年来,国家知识产权局评定的中国专利奖金奖、银奖、优秀奖,被驳回、随机抽取的专利与训练集的专利样本共计400篇作为验证集。

由此可知,验证结果具有突出的显着性,且与预期相符。

 

5.2.宏观验证

 

Sanders 系统地研究了专利的价值,他们通过大规模问卷调查发现最有价值的10%的专利占了专利总价值的80%以上,专利价值的分布是一个长尾,只有很少的专利会产生高额的回报,专利价值的分布近似遵从对数正态分布 [6] 。

 

通过对全部专利样本进行价值计算,按照价值分段数量排列,得出如下分布图。可以看出,全体专利价值的分布情况,符合正态分布,与宏观结论相符。

6.结语

 

本文建立了一套涵盖技术、法律、市场三个维度22项指标的双层专利价值评价体系,并在评价体系的基础上利用大数据和人工智能算法求出专利的实际量化价值。该方法提高了专利评价的效率和准确度,并克服了主观判断的随意性。但与此同时,新技术、新商业模式不断涌现,行业发展方向不断变化,评价体系也应随时代发展而不断更新和修正。同时,人工智能算法也不断推陈出新,RNN、CNN等神经网络模型 [7] 在一些场景下已展现出不俗的表现,亦或成为专利评价新的有力的解题工具,仍需不断探索和求证。

 

参考文档

 

[1]万小丽,朱雪忠.专利价值的评估指标体系及模糊综合评价[J].科研管理,2008(02):185-191.

 

[2]中国技术交易所组织编写, 中国. 专利价值分析指标体系操作手册[M]. 知识产权出版社, 2012.

 

[3]陈健, 贾隽. 专利价值的影响因素和评估体系研究综述[J]. 西安工业大学学报, 2013, 33(007):517-525.

 

[4]周志华. 机器学习 : = Machine learning[M]. 清华大学出版社, 2016.

 

[5]于磊,刘宇迪.上市公司知识产权资产评估现状研究——基于资产评估报告书的实证分析[J].中国资产评估,2010(06):41-44.

 

[6]A F M S , B D H . Technology policy for a world of skew-distributed outcomes[J]. Research Policy, 2004, 29( 4–5):559-566.

 

[7]周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(06):1229-1251.

 

Be First to Comment

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注