数智资源网
首页 首页 大数据 查看内容

恐怖!NerdyData:颠覆传统的新型源代码搜索引擎

木马童年 2020-2-15 15:35 199 0

提到搜索引擎网站,最知名莫过于美国的Google,中国的百度,然而这两家都是搜索网站的内容,包括文字、图片、视频等。但是从今天开始,设立在纽约的NerdyData服务器已经颠覆了类似于Google百度这样的传统搜索引擎行 ...

提到搜索引擎网站,最知名莫过于美国的Google,中国的百度,然而这两家都是搜索网站的内容,包括文字、图片、视频等。但是从今天开始,设立在纽约的NerdyData服务器已经颠覆了类似于Google百度这样的传统搜索引擎行业。NerdyData 使得企业家能够搜索他们竞争对手的源代码而不只是搜索网站的内容。

恐怖!NerdyData:颠覆传统的新型源代码搜索引擎

23岁的联合创始人Steve Sonnes在今天下午的采访中提到,“当你从一个不同的角度去思考,你将发现我们可以用许多不同的方法去重构搜索方式,NerdyData 就是专为搜索源代码而推出的搜索引擎。”

Sonnes 认为高效的搜索引擎专业人士可以使用 NerdyData 来检查他们自己和竞争对手的链接,从而创造正如他所称的打造品牌权威的机会;搜索 HTML 素材中的关键字,并且分析 CSS、Javascript 和 DOM 等一切可用来建立一个网站的资源。

企业家也能够看到他们的竞争对手使用的是哪一种部件,看到同一个谷歌分析账户名下的网站,哪些网站被某一团队贴上他们标题标签,最终还能知道哪些网站使用某一特定颜色。

公司的网络爬虫已经浏览过超过一亿四千万的主页并且收集了6.2万亿字节的关于 HTML,Javascript和 CSS 的代码。他们也设计了几个网站接口允许使用者查询网页的源代码或者在企业内部下载包含具体条目的网站清单。

恐怖!NerdyData:颠覆传统的新型源代码搜索引擎

Sonnes 写到,“我们甚至为引擎优化和市场者提供专门的搜索接口,这些接口能够为你搜索具体的HTML 标签,类似于元数据描述和元关键字。”

虽然这个网站目前只完成了不到百分之一的工程量,但是他们并不想在发展的早期阶段就揭示网站未来的特性。

Sonnes 和他的追随者,23岁的共同创始人 David Bielik,他们也是刚从纽约的 Stony Brook 大学毕业,在那里他们一见如故。在建立域名搜索引擎的同时他们创造了网络爬虫,如今网络爬虫被用于检索和搜寻源代码。

Sonnes 说:“没有其他人在做这个,所以我们要成为最好的,我们花了三个月的时间来构造完整的 NerdyData 架构,今后我们会仍然努力工作尽我们最大的能力让它逐渐走上正轨。”

恐怖!NerdyData:颠覆传统的新型源代码搜索引擎

没有 NerdyData,对于在那些每天在网上点击页面详情的浏览者而言,仍然要面对依旧存在的大量的旧信息,而 NerdyData 只是同时横跨在数以百万计的网站上做这件事情而已。

一个基础账户每个月可以搜索200次,并且每次查询有10个结果是免费的;一个专业账户每个月花费99美元,并且可以进行1200次搜索,每次搜索获得高达5000个以上的结果,对于企业账户而言,每个月消费149美元,每个月获得超过3000次搜索,并且每次查询可获得1万个搜索结果。

Sonnes 和 Bielik 已经带领他们的公司走过了困难期,他们现在有五台服务器,每台服务器每月花费是400美元。他们有600个使用者使用基本包,但只有不超过10个付费使用者。

“这就是我们每个月的收入。”Sonnes自豪地说。

搜索引擎 企业家 创始人 网络爬虫
0
为您推荐
HIVE数据仓库完美实战课程,资源教程下载

HIVE数据仓库完美实战课程,资源教程下载

课程名称【快速掌握HIVE视频教程】HIVE数据仓库完美实战课程课程目录├第一周:hive基…...

尚硅谷大数据Flink技术与实战,资源教程下载

尚硅谷大数据Flink技术与实战,资源教程下载

课程名称尚硅谷大数据Flink技术与实战课程目录理论_Flink基础 001__Flink理论_Flink…...

廖雪峰-2019大数据分析精品资料价值1980元,资源教程下载

廖雪峰-2019大数据分析精品资料价值1980元,资源教程

课程介绍:廖雪峰大神历时3个月打磨出来的《数据分析必备技能》的视频学习资料,由浅…...

尚硅谷-大数据项目之电商数仓教程下载

尚硅谷-大数据项目之电商数仓教程下载

课程介绍:本课程以国内电商巨头实际业务应用场景为依托,对电商数仓的常见实战指标以…...