欢迎光临
我们一直在努力

php抓取网站图片源码

<?php

/*完成网页内容捕获功能*/

function get_img_url($site_name){

    $site_fd = fopen($site_name, "r");

    $site_content = "";

    while (!feof($site_fd)) {

        $site_content .= fread($site_fd, 1024);

    }

   /*利用正则表达式得到图片链接*/

    $reg_tag = '/<img.*?\"([^\"]*(jpg|bmp|jpeg|gif)).*?>/';

    $ret = preg_match_all($reg_tag, $site_content, $match_result);

    fclose($site_fd);

    return $match_result[1];

/* 对图片链接进行修正 */

function revise_site($site_list, $base_site){

    foreach($site_list as $site_item) {

        if (preg_match('/^http/', $site_item)) {

            $return_list[] = $site_item;

        }else{

            $return_list[] = $base_site."/".$site_item;

    }

    }

    return $return_list;

/*得到图片名字,并将其保存在指定位置*/

function get_pic_file($pic_url_array, $pos){

    $reg_tag = '/.*\/(.*?)$/';

    $count = 0;

    foreach($pic_url_array as $pic_item){

        $ret = preg_match_all($reg_tag,$pic_item,$t_pic_name);

        $pic_name = $pos.$t_pic_name[1][0];

        $pic_url = $pic_item;

    print("Downloading ".$pic_url." ");

        $img_read_fd = fopen($pic_url,"r");

        $img_write_fd = fopen($pic_name,"w");

        $img_content = "";

        while(!feof($img_read_fd)){

            $img_content .= fread($img_read_fd,1024);

        }

        fwrite($img_write_fd,$img_content);

        fclose($img_read_fd);

        fclose($img_write_fd);

        print("[OK] ");

    }

    return 0;

function main(){

/* 待抓取图片的网页地址 */

    $site_name = "http://uuhy.com/html/26785.html";

    $img_url = get_img_url($site_name);

    $img_url_revised = revise_site($img_url, $site_name);

    $img_url_unique = array_unique($img_url_revised); //unique array

    get_pic_file($img_url_unique,"./");

main();

?>

  • 海报
海报图正在生成中...
赞(0) 打赏
声明:
1、本博客不从事任何主机及服务器租赁业务,不参与任何交易,也绝非中介。博客内容仅记录博主个人感兴趣的服务器测评结果及一些服务器相关的优惠活动,信息均摘自网络或来自服务商主动提供;所以对本博客提及的内容不作直接、间接、法定、约定的保证,博客内容也不具备任何参考价值及引导作用,访问者需自行甄别。
2、访问本博客请务必遵守有关互联网的相关法律、规定与规则;不能利用本博客所提及的内容从事任何违法、违规操作;否则造成的一切后果由访问者自行承担。
3、未成年人及不能独立承担法律责任的个人及群体请勿访问本博客。
4、一旦您访问本博客,即表示您已经知晓并接受了以上声明通告。
文章名称:《php抓取网站图片源码》
文章链接:https://www.456zj.com/9228.html
本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址