shisgmei 发表于 2017-5-19 12:02:15

一段perl代码,包含网页抓取与字符串编码

  use LWP::Simple;
use utf8;
use Encode;
  open F,'>d:/bc.html';
  
$content = get("http://www.163.com");
#Encode::_utf8_on($content);
$content=encode('gb2312',$content);
  die "Couldn't get it!" unless defined $content;
print F $content;
  #print 'complete';
close F;
  以上代码去网页下载网页文件,然后写入文件中,
  抓取网页使用了LWP::Simple
  字符串编码使用了Encode模块的encode方法,若不进行转码则会乱码
页: [1]
查看完整版本: 一段perl代码,包含网页抓取与字符串编码