构建“天罗地网”,必须将“点”(精确标识)、“线”(技术分类)、“面”(相关技术)和“网”(关联追踪)结合,进行多轮迭代检索。
一、 核心检索维度与具体内容
1.“点”式检索—基于精确标识
目标化合物名称,国际非专利药品名称(INN)、通用名、商品名、研发代号。
CAS登记号,最精确的化学标识符。专利中经常不记载CAS号,或仅记载中间体、盐的CAS号。
化学结构式/亚结构,使用专业的化学结构检索数据库,如SciFinder、Reaxys、Patentscope的化学子结构检索。
2. “线”式检索,基于专利分类体系—系统性的框架
是实现全面性的核心,必须超越A61K 31/和A61P。
(1)国际专利分类(IPC)- 基础框架
A61K 31/00,有机有效成分,必须结合其小组进行精细化检索。例如,A61K 31/70碳水化合物;A61K 31/7052含有糖基的化合物(核苷、核苷酸等)。
A61P,治疗活性。用于限定用途,必须与A61K 31/组合使用。例如,A61P 35/00抗肿瘤药,A61P 9/00治疗心血管系统疾病的药物。
C部(化学)相关分类,C07C,无环或碳环化合物(化合物制备专利);C07D,杂环化合物,绝大多数药物分子;C07F,含除碳、氢、卤素、氧、氮、硫、硒或碲以外的其他元素的无环,碳环或杂环化合物,如含金属药物;C07J,甾族化合物。
(2)联合专利分类(CPC)- 更精细、更关键的武器
CPC在医药领域比IPC精细得多,是提高查全率和查准率的关键。基于结构的精细分类,在A61K 31/00下延伸,CPC对药物化学结构的分类极其详尽。例如,针对激酶抑制剂,可能有A61K 31/4439非稠合吡啶、A61K 31/496非环氮上至少有一个氮作为环杂原子的六元杂环等。利用CPC的层级关系,从较上位的组开始,逐步向下位组扩展。
基于治疗领域的精细分类在A61P下延伸,同样,CPC的A61P分类更具体。例如A61P 35/02对白血病有特异性的。CPC特有的高价值分类号,A61K 2300/00,剂型特征。如A61K 2300/10缓释制剂、A61K 2300/20靶向制剂。用于检索特定的制剂专利。A61K 9/00,以特殊物理形态为特征的医药配制品,如微粒、脂质体。与化合物专利组合检索。Y02A 50/30,针对抗感染药物的气候变化适应技术分类。
3. “面”式检索,基于技术主题与关键词—查全的关键
关键词用于捕捉分类体系无法精确涵盖的内容,以及专利文本中可能出现的不同表述。
技术主题关键词,靶点/机制,如 EGFR inhibitor, PD-1 antagonist, SGLT2。疾病/症状,如 non-small cell lung cancer, heart failure, neuropathic pain。生物学术语,如 apoptosis, angiogenesis。
化学结构关键词/片段,官能团/母核,如 “pyridine”, “piperazine”, “amide”, “sulfonyl”。用于检索马库什通式。
取代基,如 “fluoro”, “methyl”, “hydroxy”。
结构描述词,如 “salt”, “solvate”, “cocrystal”, “polymorph”。
专利法律/用途关键词,use for treating, pharmaceutical composition, method of administration, dosage regimen.
二、 组合检索策略
“分类号+关键词”核心组合,
示例1(检索特定结构类别的抗癌药),
(CPC=(A61K31/4439 OR A61K31/496) AND CPC=(A61P35/00)) AND (title,abstract,claims):(EGFR OR "epidermal growth factor receptor")
示例2(检索某化合物的所有剂型专利),
(CPC=(A61K2300/00) OR CPC=(A61K9/00)) AND (title,abstract,claims):(YourCompoundName OR its_CAS)
“分类号迭代扩展”策略,
先使用较上位的CPC分类如A61K31/00进行初步检索,分析结果中高频出现的下位分类号,将其纳入下一轮检索。
同时检索IPC和CPC,因为一些老专利可能只标有IPC,而新专利标有CPC。
“结构式+分类号/关键词”策略,在支持化学结构检索的数据库中,先绘制目标化合物的核心母核或关键片段进行子结构检索。在结果中,再用A61P(如A61P35/00)或疾病关键词进行二次筛选,快速定位相关专利。
三、 针对“马库什通式”专利的专项检索策略
使用最相关的CPC分类号,通式专利通常会被分入最能体现其核心化学结构的CPC小组。
关键词使用“化学片段”而非完整结构,提取通式中不变或常见的核心片段,如一个特定的双环体系、一个特殊的酰胺连接键作为关键词。
关注主要原研药企,锁定在该靶点或疾病领域已知的头部公司如辉瑞、罗氏、诺华等,对其进行申请人检索,并结合分类号/关键词过滤。
引证检索,找到一篇已知的相关专利,对其引用文献和被引文献进行追溯。通式专利之间通常会相互引用。
四、迭代与验证流程
由宽到窄,多次迭代,第一轮,宽泛检索(如,(A61K31/ AND A61P35/) AND (关键词)),了解技术全景,收集相关专利的分类号和关键词特征。第二轮,优化检索式,利用第一轮发现的高频分类号和同义词,提高查全率。第三轮,聚焦检索,针对高风险专利的申请人和引证网络进行深度挖掘。
“已知专利”验证法,找几份相关的核心专利作为“种子”。运行检索式,检查是否能覆盖这些“种子”。如果不能,分析原因,修正检索式,是分类号不全?还是关键词缺失?
多数据库交叉验证,不要在单一数据库中完成检索。必须使用专业的商业数据库,如德温特世界专利索引(DWPI)。DWPI的价值在于,a) 对专利家族进行去重和归一化处理;b) 提供由专家重新编写、包含更多技术细节和用途的标题与摘要;c) 有自己独特的分类和手工代码,是另一个强大的检索维度。
使用化学文摘社(CAS)的SciFinder进行化学结构检索,作为补充。
总结与最终建议
保证药用专利FTO检索全面性的金科玉律,多维度组合,结构式 + CPC分类 + 关键词 + 申请人 + 引证,五维一体。动态迭代,检索是一个学习、反馈、修正的循环过程,不是一次性动作。经验判断,最终,识别高风险的通式专利,需要检索者具备相当的药物化学知识和专利法律知识,能够从宽泛的通式中预判其权利要求的实际覆盖范围。