介绍:
一个新的Ruby解析HTML/XML的ruby库
安装:
sudo apt-get install libxml2-dev libxslt1-dev
sudo gem install nokogiri
视频:
http://railscasts.com/episodes/190-screen-scraping-with-nokogiri
源码地址:
http://github.com/tenderlove/nokogiri/
demo(nokogiri_google.rb):
require 'rubygems'
require 'nokogiri'
require 'open-uri'
url = 'http://www.google.cn/search?q=tenderlove'
doc = Nokogiri::HTML(open(url))
doc.css('h3.r a.l').each do |link|
puts link.content
end
puts '--------------------------------------------------'
doc.xpath('//h3/a[@class="l"]').each do |link|
puts link.content
end
puts '--------------------------------------------------'
doc.search('h3.r a.l', '//h3/a[@class="l"]').each do |link|
puts link.content
end
分享到:
相关推荐
nokogiri-1.6.6.2-x64-mingw32.gem 使用linux-vm / win8.1上的rako-compile,rake-compile-dock(感谢@luislavena !!)交叉编译的宝石(感谢nokogiri团队!) 出于礼貌而发布,以备不时之需。 只需将其安装为系统中...
当然,该库的API目前与Nokogiri不兼容。 $ ruby benchmarks/nokogiri_benchmark.rb Warming up -------------------------------------- Nokogiri::HTML 2.000 i/100ms NokogiriRust::...
*) # apt-get install ruby ruby-nokogiri ruby-nokogiri-diff ruby-nokogumbo# gem install git_stats的Ubuntu $ sudo apt-get install ruby ruby-dev gcc zlib1g-dev make$ sudo gem install gi
sudo apt-get install ruby2.5-dev ruby-nokogiri rubygems sudo apt purge ruby2.0* ruby2.1 ruby2.3 ruby2.4* sudo gem install json jekyll bundler #ggf.: #ln -s /usr/bin/gem$VERSION$ /usr/bin/gem #sudo ...
sudo apt-get install ruby2.5-dev ruby-nokogiri rubygems sudo apt purge ruby2.0* ruby2.1 ruby2.3 ruby2.4* sudo gem install json jekyll bundler #ggf.: #ln -s /usr/bin/gem$VERSION$ /usr/bin/ge
LCBonAp LC 菜单项目的 Webapp 版本 ...我们目前使用的库:Nokogiri--Ruby gem for webscraping:此处指南: ://hunterpowers.com/data-scraping-and-more-with-ruby-nokogiri-sinatra-and-heroku/
1.直接以字符串形式获取nokogiri对象: html_doc = Nokogiri::HTML(<html><body><h1>Mr. Belvedere Fan Club</h1></body></html>) xml_doc = Nokogiri::XML(<root><aliens><alien><name>...
主要区别Nokogiri支持HappyMapper Happymapper允许您解析XML数据并将其快速轻松地转换为ruby数据结构。 这个项目是jnunemaker首先完成的伟大工作的一个分支。 主要区别Nokogiri支持使用相同的HappyMapper标记解析...
制浆计划者 根据启用的Red Hat回购给出Pulp的...yum install rh-ror42-rubygem-nokogiri unzip git 在RHEL系统上运行。 git clone https://github.com/RedHatSatellite/pulp-planner.git cd pulp-planner/bin scl ena
依存关系Ruby> = 2.5 宝石: addressable domain_name http-cookie mime-types net-http-digest_auth net-http-persistent nokogiri rubyntlm webrick webrobots支持: 可以在此处找到错误跟踪器:例子如果您刚刚...
程序包(也称为库)包含可以由Ruby程序调用的一组功能,例如读取和解析XML文件。 我们将这些软件包称为“宝石”,而RubyGems是在您的Ruby环境中安装,创建,管理和加载这些软件包的工具。 RubyGems还是RubyGems....
安装Ruby和库。 (假设使用基于Ubuntu / Debian的发行版) apt install ruby ruby-dev bundler build-essential patch zlib1g-dev liblzma-dev # zlib1g-dev is required by nokogiri # see: ...
用于CrystalHTML解析器库,例如惊人的 Ruby gem。 我不会假装Crystagiri像Nokogiri那样做。 欢迎所有帮助! :) 安装 将此添加到应用程序的shard.yml : dependencies : crystagiri : github : madeindjs/...
Mechanize¶↑docs.seattlerb.org/mechanize github.com/sparklemotion/mechanize描述¶↑Mechanize库用于自动与网站交互。 Mechanize自动存储和...依赖项¶↑ruby 1.9.2或更高版本的nokogiri支持:¶↑Bug跟踪器可用
该存储库保存网站的源代码,该... gem install nokogiri -v '1.6.6.2' 克隆此存储库后,运行: bundle install以下载构建所需的依赖项。 bundle exec jekyll serve在本地运行,或bundle exec jekyll build ./site
使用第 3 方 ruby 库:iwb-项目存档的 xml 导入规则如何从 Windows 运行当前的 ruby 脚本: 最新版本在从源代码构建 Nokogiri ruby gem 时存在一些问题,因此我建议尝试 Ruby 2.00: 从以下网址下载 ...
这是Algorithms and Programming II网站的资源库,发布在: 网站更新说明 通过推送到master分支,根目录中的所有提交都会在页面上自行发布。 GitHub负责该过程。 要在本地查看更改,必须安装 。 文件非常简单: #...
这是的源文件存储库。 问题,错误和请求 我们欢迎您的贡献和反馈。 请在我们的提交请求,我们将进行调查。 开发环境安装 TLDR版本如下: 确保您已安装 ; 您需要版本2.2.2或更高版本: ruby --version 确保已安装 ...
{罗宁::网络}是一个Ruby库,它提供了网络刮蜘蛛功能的支持。 产品特点 HTML / XML解析/构建(使用 )。 自动化的Web浏览(使用 ) 提供流行的。 将集成到{Ronin :: Web :: Spider}中。 提供{Ronin :: Web :: ...