当前位置：首页 > 引流 > 正文内容

c#打开浏览器并全屏（设置ie浏览器打开全屏）

admin3年前 (2022-10-11)引流923

基于C#.NET+Phantomjs+Sellenium的高级网络爬虫程序。可执行javascript代码、触发各类事件、操纵页面Dom结构、甚至可以移除不喜欢的css样式。

很多网站都用Ajax动态加载、翻页，比如携程网的评论数据。如果是用之前那个简单的爬虫，是很难直接抓取到所有评论数据的，我们需要去分析那漫天的Javascript代码寻找API数据接口，还要时刻提防对方增加数据陷阱或修改API接口地。

如果通过高级爬虫，就可以完全无视这些问题，无论他们如何加密Javascript代码来隐藏API接口，最终的数据都必要呈现在网站页面上的Dom结构中，不然普通用户也就没法看到了。所以我们可以完全不分析API数据接口，直接从Dom中提取数据，甚至都不需要写那复杂的正则表达式。

主要特性

支持Ajax请求事件的触发及捕获；
支持异步并发抓取；
支持自动事件通知；
支持代理切换;
支持操作Cookies；

运行截图

抓取酒店数据

抓取评论数据

示例代码

 /// <summary>
    /// 抓取酒店评论
    /// </summary>
	static void Main(string[] args)
    {
        var hotelUrl = "http://hotels.ctrip.com/hotel/434938.html";
        var hotelCrawler = new StrongCrawler();
        hotelCrawler.OnStart += (s, e) =>
        {
            Console.WriteLine("爬虫开始抓取地址：" + e.Uri.ToString());
        };
        hotelCrawler.OnError += (s, e) =>
        {
            Console.WriteLine("爬虫抓取出现错误：" + e.Uri.ToString() + "，异常消息：" + e.Exception.ToString());
        };
        hotelCrawler.OnCompleted += (s, e) =>
        {
            HotelCrawler(e);
        };
        var operation = new Operation
        {
            Action = (x) => {
                //通过Selenium驱动点击页面的“酒店评论”
                x.FindElement(By.XPath("//*[@id='commentTab']")).Click();
            },
            Condition = (x) => {
                //判断Ajax评论内容是否已经加载成功
                return x.FindElement(By.XPath("//*[@id='commentList']")).Displayed && x.FindElement(By.XPath("//*[@id='hotel_info_comment']/div[@id='commentList']")).Displayed && !x.FindElement(By.XPath("//*[@id='hotel_info_comment']/div[@id='commentList']")).Text.Contains("点评载入中");
            },
            Timeout = 5000
        };

        hotelCrawler.Start(new Uri(hotelUrl), null, operation);//不操作JS先将参数设置为NULL

        Console.ReadKey();
    }

github：https://github.com/microfisher/Strong-Web-Crawler

标签：浏览器

随机文章
热门文章
热评文章

扫描二维码推送至手机访问。

本文链接：http://73ya.com/yinliu/2071.html

分享给朋友：

返回列表

上一篇：analyzer软件数据导出（数据录入导出软件）

下一篇：什么记账软件最好用（免费的记账软件有哪些）

c#打开浏览器并全屏（设置ie浏览器打开全屏）

主要特性

运行截图

示例代码

“c#打开浏览器并全屏（设置ie浏览器打开全屏）” 的相关文章

如何做抖音内容营销怎么营销抖音视频

抖音短视频运营技巧抖音运营技巧有哪些

短视频制作的基本流程,各种小技巧

快手营销致胜的关键,肯德基品牌只需一分钱

2020年义乌有多少人口义乌人口2020总人数口介绍

雅诗兰黛的睫毛膏多少钱（雅诗兰黛睫毛膏价格介绍图）

Copyright 73ya.com Rights Reserved.
赣ICP备2022005602号-1
赣公网安备36070302361030号

c#打开浏览器并全屏（设置ie浏览器打开全屏）

主要特性

运行截图

示例代码

“c#打开浏览器并全屏（设置ie浏览器打开全屏）” 的相关文章

如何做抖音内容营销 怎么营销抖音视频

抖音短视频运营技巧 抖音运营技巧有哪些

短视频制作的基本流程,各种小技巧

快手营销致胜的关键,肯德基品牌只需一分钱

2020年义乌有多少人口 义乌人口2020总人数口介绍

雅诗兰黛的睫毛膏多少钱（雅诗兰黛睫毛膏价格介绍图）

Copyright 73ya.com Rights Reserved.赣ICP备2022005602号-1赣公网安备36070302361030号

如何做抖音内容营销怎么营销抖音视频

抖音短视频运营技巧抖音运营技巧有哪些

2020年义乌有多少人口义乌人口2020总人数口介绍

Copyright 73ya.com Rights Reserved.
赣ICP备2022005602号-1
赣公网安备36070302361030号