温故而知新,再话 Python 动态导入
温故而知新,再话 Python 动态导入 本文回顾了 Python 中的动态导入机制,并通过作者开发基于 ChatGPT 的人工智能管家 Jarvis 的实践,探讨了如何利用动态导入实现插件化和按需加载模块。作者介绍了使用 importlib 模块和 __import__ 函数来动态导入模块的方法,并通过示例代码展示了如何根据不同条件导入不同的模块,以及如何通过动态导入解决环境差异带来的问题。文章还提到了作者对使用 virtualenv 管理 Python 版本和开发环境的体验。
视频是不能 P 的系列:使用 Milvus 实现海量人脸快速检索
视频是不能 P 的系列:使用 Milvus 实现海量人脸快速检索 本文探讨了如何利用 Milvus 向量数据库实现海量人脸数据的快速检索。作者首先回顾了人脸识别项目中遇到的挑战,包括性能下降和快速判断人脸是否在样本库中的问题。随后,文章介绍了向量化的概念以及 Milvus 的核心功能——相似度检索。通过详细的步骤和代码示例,展示了如何安装 Milvus、创建集合、插入数据、创建索引以及执行相似度搜索。此外,文章还讨论了 Milvus 在人脸识别上的应用,包括提取人脸特征、写入向量数据库以及查询最相似的人脸。最后,作者对使用向量数据库进行人脸识别的尝试和探索进行了总结,指出尽管向量数据库可能无法完全避免循环结构的宿命,但在样本数目不大的情况下,其优势并不显著,但仍然是值得尝试的方案。
视频是不能 P 的系列:使用 Dlib 实现人脸识别
视频是不能 P 的系列:使用 Dlib 实现人脸识别 本文介绍了使用 Dlib 库实现人脸识别的方法。通过 Dlib 的 compute_face_descriptor() 方法,将人脸转化为 128 维向量,再利用支持向量机(SVM)进行模型训练,以识别不同人物。文章详细记录了从人脸检测到特征值计算,再到模型训练和识别的整个流程,并通过实验显示,该方法的识别率达到了 94.58%,是一种相对可靠的人脸识别方案。此外,还探讨了使用 SVM 优化识别效率的可能性以及 OpenCV 的 LBPH 方法的局限性。
视频是不能 P 的系列:OpenCV 和 Dlib 实现表情包
视频是不能 P 的系列:OpenCV 和 Dlib 实现表情包 2020 年底,博主开启了一个关于视频不能 P 的系列,探讨了视频/图像处理思路,涉及 OpenCV、Dlib 和表情包等。Dlib 通过 68 个特征点定位人脸五官,实现人脸检测和识别,提供更多探索可能。文章介绍了使用 Dlib的人脸特征点绘制和抠取,生成表情包的过程,包括创建掩膜、裁切图片、阈值处理等。最终,将人脸与熊猫人合成为表情包。文章总结了 Dlib 的应用,探讨了处理图像的有趣过程,展示了程序员的浪漫之处。
Python 图像风格化迁移助力画家梦想
Python 图像风格化迁移助力画家梦想 这篇文章探讨了风格化迁移的概念,并以图像风格化迁移为例进行讨论。文章提及了人人都是食神、产品经理、艺术家的观点,引出了图像风格化迁移的背景和意义。详细介绍了风格化迁移的定义、实现原理以及算法支撑,包括神经网络在图像风格化迁移中的应用。最后,作者分享了自定义模型训练的尝试和结果,并通过图像展示了传统水墨画风格迁移的效果。文章结尾以对艺术与技术的思考和对创作的热情做出总结。
通过 Python 预测 2021 年双十一交易额
通过 Python 预测 2021 年双十一交易额 本文通过 Python 编程实践,探讨了如何预测 2021 年双十一的交易额。作者首先回顾了历年双十一的交易数据,并利用最小二乘法和线性回归原理进行分析。通过 Python 的 scikit-learn 库中的 LinearRegression 类,作者对数据进行了线性回归处理,并尝试了一次方程、二次方程和三次方程来提高拟合效果。最终,作者发现三次方程的拟合效果最佳,预测出的 2021 年双十一交易额约为 6213 亿。文章还讨论了其他可能的模型,如指数模型,并提出了对未来不确定性的哲学思考。
使用 Python 自动识别防疫健康码
使用 Python 自动识别防疫健康码 本文讨论了朋友因疫情取消自驾游计划,作者尝试利用Python编写程序自动识别防疫二维码的原理和实现过程。通过颜色识别、二维码检测、色彩检测以及OCR识别等步骤来实现。作者展示了处理防疫二维码的图块检测、二维码检测、色彩检测、OCR识别,并展示了通过摄像头检测防疫二维码的成品。文章反思了基础性研究的现状,探讨了科学家与普通人在选择挣快钱还是挣慢钱的问题。
通过 Python 分析 2020 年全年微博热搜数据
通过 Python 分析 2020 年全年微博热搜数据
基于 Python 和 Selenium 实现 CSDN 一键三连自动化 博主感受到了面对年轻"后浪"压力的危机感,提及IT行业35岁门槛,称赞年轻技术大佬[Catcher Wong](https://www.cnblogs.com/catcher1994)的技术实力。讨论了"不正经"博主Kimol君通过标题党和评论互刷等手段获取流量的问题,提到评论风格和团队作弊行为。另外,探讨了年轻人不讲"武德"的现象,介绍了使用Selenium和Python刷CSDN点赞、收藏等操作的技术实现方法。最后,分享了Python数据挖掘专栏和技术驱动的浏览器操作配置方法。
使用多线程为你的 Python 爬虫提速的 N 种姿势,你会几种? 博主通过优化一个多年前编写的爬虫程序,深入探讨了 Python 中的多线程编程及其在爬虫领域的应用。文章首先介绍了线程和进程的基本概念,并通过代码示例展示了如何使用 `Thread`、`ThreadPool`、`ThreadPoolExecutor`、`Process`、`ProcessPool` 和 `ProcessPoolExecutor` 实现多线程和多进程下载。接着,文章讨论了由于 Python 的 GIL 特性,多线程在 Python 中主要适用于I/O密集型任务,而多进程则适用于CPU密集型任务。此外,博主还介绍了如何利用 `asyncio` 和 `requests` 实现异步I/O,以进一步提升爬虫程序的效率。文章最后通过对比不同方法的执行时间,展示了各自性能,并提供了一个福利,开源了示例爬虫程序给读者参考。
实现网页长截图的常见思路总结 作为一个经常在博客上分享内容的作者,对国内互联网丧失信仰感到担忧,指出厂商试图打造信息孤岛以增强用户黏度。分享了通过浏览器、Selenium、JavaScript和第三方工具实现网页长截图的方法,包括使用Chrome和Firefox的内置功能、Selenium库和html2canvas等工具。提到了几个在线服务如PickFrom和Tiomg,推荐使用Tiomg免费服务生成长截图。最后,提到了对技术含量较高的项目缺乏动力,分享了长截图实验经历。
视频是不能 P 的系列:OpenCV 人脸检测
视频是不能 P 的系列:OpenCV 人脸检测 在 2020 年的尾声,作者通过一个技术博客探讨了人工智能与视频、图像处理技术的发展,以及这些技术背后的隐私和伦理问题。文章以 OpenCV 库为例,详细介绍了如何利用其 CascadeClassifier 模块进行人脸检测,并通过编程示例展示了在图片和视频中实现人脸检测和“狗头”表情的叠加效果。作者强调了 OpenCV 在人脸识别和图像处理方面的强大功能,并指出这些技术可以应用于保护隐私等多种场景。最后,作者反思了技术发展对个人自我认知的影响,并鼓励读者在评论区交流想法。
作为技术宅的我,是这样追鬼滅の刃的
作为技术宅的我,是这样追鬼滅の刃的 这篇文章讨论了作者对动漫《鬼灭之刃》的热爱以及如何通过抓取漫画、制作电子书、制作表情包、生成视频和GIF等方式来追番和分享乐趣。作者表达了对热血少年漫的热爱和追求中二信仰的态度,以及对生活的乐观和勇敢面对困难的态度。文章展示了如何利用Python中的各种库和工具来实现这些创意。
使用 Python 抽取《半泽直树》原著小说人物关系
使用 Python 抽取《半泽直树》原著小说人物关系 2020 年的年度日剧《半泽直树》续集获得了极高的评价,本文通过 Python 编程,结合自然语言处理技术,提取了原著小说中的人物关系。在准备工作中,需要准备中文语料、安装必要的第三方库,并使用 Gephi 软件进行人物关系的可视化展示。文章介绍了共现网络的基本原理,并通过 RelationExtractor 类来抽取人物关系,最终使用 Gephi 和 PyECharts 对结果进行可视化。结果显示,大多数人物关系是正确的,但不可避免地存在一定局限性,如无法解决在A和B交谈中提到C的问题,以及女性角色的缺失等。为了改进这些不足,可以尝试使用文本分类模型和依存句法来识别实体间的关系,哈工大的语言技术平台(LTP)在这方面可以提供帮助。
厉害了!打工人用 Python 分析西安市职位信息 本文主要通过抓取Boss直聘、智联招聘、前程无忧三个招聘网站的信息,分析了西安市的求职招聘情况。重点讨论了行业结构、学历结构、薪资待遇、学历与薪资关系、经验与薪资关系、招聘热词等方面。结论包括西安市主要行业、学历与薪资正相关、经验与薪资正相关、热门标签如五险一金、年终奖金等。整体显示西安市求职招聘情况,以及人们关注的重点。