[算法] Python 计算出现最多的前100个单词

Python 计算单词数


[算法] 海量日志数据, 提取出某日访问百度次数最多的那个IP

海量日志数据, 提取出某日访问百度次数最多的那个IP


[学习] NLTK Python自然语言处理

第2章 获得文本语料和词汇资源


[学习] NLTK Python自然语言处理

第1章 语言处理与Python


[算法] Python 快速排序

Python 快速排序


[基础] 在Python中获得字典列表中最大值与最小值

假设有字典列表:dict_list = [{'price': 99, 'barcode': '2342355'}, {'price': 88, 'barcode': '2345566'}, {'price': 77, 'barcode': '2342377'}], 要求price的最大值与最小值


[解决] Python lxml wrapping elements

有的网页中正文没有使用<div>进行包装, 结果提取正文时只提取了某一段, 而不是作为整体的正文, 一开始直接将<body>元素变成<div>, 发现会有其它副作用, 因为其它代码中有通过标签是否是body作为判断的代码. 因此考虑默认为<body>的子元素加一层<div>包装.


[解决] 使用lxml过滤HTML中class或id符合特定正则的元素

使用lxml过滤HTML中class或id符合特定正则的元素


[项目] 书签云项目

我的基于Tornado的项目


[基础] 给Python初学者的一些技巧

给Python初学者的一些技巧