• Python自学指南 | 怎样把最好用的Python教程爬取下来?

    很多Python初学者都是从廖雪峰的Python教程开始的。我也是廖老师教程的忠实读者。今天学到了爬虫,就想把廖老师的教程爬取下来,方便查阅。下面是我爬取这个教程的简单过程。 一个简单的爬虫大概包含下面的4个步骤:1.获取网页的URL2.下载网页的HTML文件3.解析下载到的HTML,提取所需的数据4.将提取的数据存储起来 首先,看一下如何获取廖老师教程的全部URL。在浏览器中打开教程的首页,查看源文件,发现教程的URL如下图所示: Paste_Image.png 从源文件中可以看到,每篇教程都…

  • 传说中Python最难理解的点,看这完篇就够了

    这不是我第一次学Python入门课,去年、前年我都学过Python入门。所以文章的标题一点都没有标题党的意思。但是整个入门篇还有一个最难的东西没有讲,这个知识点好多书里面对这块要么不讲,要么就是讲的太深奥,这个知识点卡在那里很难受。 这块到底是什么的,猜对了就是传说中的装饰器,我记得我好几年前刚学Python的时候,看装饰器就觉得看九阴真经里面的怪文字,完全看不懂,确实装饰器是一个非常难以理解的概念。 1.什么是装饰器 网上有人是这么评价装饰器的,我觉得写的很有趣,比喻的很形象 每个人都有的内裤…

  • 如果你初学Python学不好,必须得看下这个Python老鸟的建议

    从2013年开始接触Python以来,我体验过阅读书籍,学习MOOC,查阅文档,谷歌搜索,逛编程社区。现在仍在学习Python中,走了很多的弯路。成功的道路各有不同,失败的地方却是种种。我想把我学习Python过程中走过的一些弯路说给大家,希望给初学Python的一些朋友有些帮助。 1.纸质书精读一本足矣 Python的经典书籍不少,《笨方法学Python》《Python核心编程》、《Python基础教程》等等,不少编程大牛也都会推荐自己觉得不错的书籍。 怎么选?这是个问题其实很多时候你只需要选…

  • 我们学Python时我们在学什么,不看亏大了

    这是一篇来自简书的文章,作者详细讲解了Python入门学习的一些困惑。 虽然有时觉得Python简单得不像编程语言,知乎上也有人说,“requests 好用的让人想哭”。但当我们学习一门编程语言时,要学习哪些内容,怎么学习,还是很值得深入探究的。 先看一下Python官网上的说明: powerful, fast, easy, 对,这就是赤果果的广告。不过我用下来的感觉确是如此,最大的问题是在于它太强大了有太多的库,貌似没有一个地方可以集中查看所有库的文档(https://pypi.Python….

  • python入门经典 | 如何用Python检测伪造的视频

    译者注:本文以一段自打24小时耳光的视频为例子,介绍了如何利用均值哈希算法来检查重复视频帧。以下是译文。 有人在网上上传了一段视频,他打了自己24个小时的耳光。他真的这么做了吗?看都不用看,肯定没有! 前几天,我浏览YouTube的时候,看到了一段非常流行的视频。在视频里,一个人声称自己要连续打脸24小时。视频的长度就是整整的24小时。我跳着看完了这个视频,确实,他就是在打自己的脸。许多评论都说这个视频是伪造的,我也是这么想的,但我想确定这个结论。 计划 写一个程序来检测视频中是否有循环。我之前…

  • 2017,最受欢迎的 15 大 Python 库有哪些?

    近年来,Python 在数据科学行业扮演着越来越重要的角色。因此,我根据近来的使用体验,在本文中列出了对数据科学家、工程师们最有用的那些库。 由于这些库都开源了,我们从Github上引入了提交数,贡献者数和其他指标,这可以作为库流行程度的参考指标。 核心库 1. NumPy (提交数: 15980, 贡献者数: 522) 当开始处理Python中的科学任务,Python的SciPy Stack肯定可以提供帮助,它是专门为Python中科学计算而设计的软件集合(不要混淆SciPy库,它是SciPy…

  • 如何判断目标站点是否为Django开发

    老文一篇,几个月以前发在【代码审计】小密圈里的文章,当时是写一个系列(Django安全漫谈),抽出其中的一部分,分享一下。 在黑盒测试的情况下,如何判断一个站是否是Django开发的?以下这些方法,很多都能在我的博客( https://www.leavesongs.com )得到印证。 利用Debug模式异常页面判断 DEBUG模式开启时,访问不存在的页面或出错的页面会有特殊的异常抛出。像这样的页面,就可以确定是Django 访问一个包含表单的页面,表单中会有一个隐藏的input,用来做CSRF…

  • Python基础入门 | 最简单的Django 简明教程

    今天给大家分享一篇入门记得Python学习文章——Django学习教程,很多人都会觉得Django很难,然而学Python必然不能补学Django。所以这篇简单的教程,献给所有喜爱Python的人。 一、Django简介 1. web框架介绍 具体介绍Django之前,必须先介绍WEB框架等概念。 web框架: 别人已经设定好的一个web网站模板,你学习它的规则,然后“填空”或“修改”成你自己需要的样子。 一般web框架的架构是这样的: 其它基于Python的web框架,如tornado、fla…

  • 编码的秘密(python版)

      编码(Python版) 最近在学习Python的过程中,被不同的编码搞得有点晕,于是看了前人的留下的文档,加上自己的理解,准备写下来,分享给正在为编码苦苦了挣扎的你。 编码的概念 编码就是将信息从一种格式转换成另一种格式,计算机只认识二进制,简单的理解,将我们眼睛看到的文字转换为计算机能够识别的二进制格式视为编码,而二进制以某种编码格式转换为我们能看的文字的过程可以看成是解码。既然计算机只能认识二进制0,1,那么我们用的字母、数字和文字等是怎样和他们对应的呢?那就请继续看吧! Py…

  • Python爬虫入门之Python爬取音频数据

    一:前言 本次爬取的是喜马拉雅的热门栏目下全部电台的每个频道的信息和频道中的每个音频数据的各种信息,然后把爬取的数据保存到mongodb以备后续使用。这次数据量在70万左右。音频数据包括音频下载地址,频道信息,简介等等,非常多。 昨天进行了人生中第一次面试,对方是一家人工智能大数据公司,我准备在这大二的暑假去实习,他们就要求有爬取过音频数据,所以我就来分析一下喜马拉雅的音频数据爬下来。目前我还在等待三面中,或者是通知最终面试消息。 (因为能得到一定肯定,不管成功与否都很开心) 二:运行环境 ID…

历经多年发展,已成为国内好评如潮的Linux云计算运维、SRE、Devops、容器云、Go、Python开发专业人才培训机构!