数据分析
使用 Python 抽取《半泽直树》原著小说人物关系
2020 年的年度日剧《半泽直树》续集获得了极高的评价,本文通过 Python 编程,结合自然语言处理技术,提取了原著小说中的人物关系。在准备工作中,需要准备中文语料、安装必要的第三方库,并使用 Gephi 软件进行人物关系的可视化展示。文章介绍了共现网络的基本原理,并通过 RelationExtractor 类来抽取人物关系,最终使用 Gephi 和 PyECharts 对结果进行可视化。结果显示,大多数人物关系是正确的,但不可避免地存在一定局限性,如无法解决在A和B交谈中提到C的问题,以及女性角色的缺失等。为了改进这些不足,可以尝试使用文本分类模型和依存句法来识别实体间的关系,哈工大的语言技术平台(LTP)在这方面可以提供帮助。