爬虫是个好东西

dyfblog 2021-12-07 原文

爬虫是个好东西，一直都是。

只是，“好”的定义却在发生着变化。

（以下纯属个人意见，不喜勿喷）

爬虫的简单定义，就是使用程序自动从网站中获取信息。

获取信息做什么？这就因人而异了。

有人用来做搜索引擎，一般情况下是造福人类。

有人用来做数据分析，有时候是兴趣、有时候是手段。

有人用来做DDOS，一般情况下是满怀恶意的。

从技术上看，爬虫仅仅是个工具。技术无罪，不存在善恶之分，善恶仅存人心。

若人心不古，则。。我也不知道会发生啥。

但对爬虫来说，则慢慢的出现了反对的声音。

有robots协议，用道德进行防御，一般没啥用。

有iptables，用ip去拒绝，一般有用，但容易误伤。

有cookie、js、css、captcha，各显神通，拉开了爬虫的梯队。

随机推荐

不知道你是否也有想过完全用自己的代码实现自己的个人博客？定制专属 UI、定制专属逻辑、在信息爆炸的时代真正地沉 […]...

链接:https://leetcode-cn.com/problems/perfect-rectangle/d […]...

不知道正在阅读本文的你，是否是因为想自己动手写一个操作系统。我觉得可能每个程序员都有个操作系统梦，或许是想亲自 […]...

代理服务器本词条由“科普中国”百科科学词条编写与应用工作项目审核。代理服务器（Proxy Server […]...

select [value] = stuff((select \’,\’+modmb […]...

# 数据结构之排序 title: 数据结构之排序 tags: 数据结构与算法之美 author: 辰砂 […]...

MySQL学习笔记（狂神说）

语法1、初识MySQL 狂神说https://space.bilibili.com/95256449/ Jav […]...

JavaScript原型链及继承

JavaScript原型链及继承在JavaScript中，所有的东西都是对象，但是JavaScript中的面 […]...

爬虫是个好东西的更多相关文章