电力系统静态电压稳定域边界快速搜索的优化模型

姜涛 张明宇 崔晓丹 李勇 石渠

DOI: 10.19595/j.cnki.1000-6753.tces.171095

1

导语

电力系统静态电压稳定域是研究、分析强随机性和不确定性因素影响下电力系统静态电压稳定性、提升大电网态势感知能力的有力工具,而构建静态电压稳定域的难点在于如何实现电压稳定域边界的快速、准确搜索。针对这一难点,本文提出一种电力系统静态电压稳定域边界的快速搜索方法。

2

研究背景

可再生能源大规模并网、大功率电力电子器件广泛应用、区域电网互联规模不断扩大,导致传统电力系统运行特性发生巨大变化,运行工况更为复杂多变,加大了电力系统电压稳定评估难度。为此,研究适用于当前电力系统的电压稳定评估方法具有十分重要的实际意义。

连续潮流(continuation power flow,CPF)是分析电力系统静态电压稳定性的重要方法。该方法针对确定的发电机调度和负荷增长方向,计算系统当前运行点至电压稳定临界点间的最大负荷裕度,根据负荷裕度来评估系统的电压稳定性。然而负荷裕度计算结果与系统注入功率的增长方向密切相关,注入功率的强随机性和不确定性将导致系统功率增长方向的强随机性和不确定性,使系统实际功率增长方向与预设功率增长方向存在一定偏差。若直接根据预设功率增长方向,采用CPF计算的负荷裕度来评估系统的电压稳定性,其评估结果并不能真实反映系统的电压稳定性。若采用CPF遍历所有可能的功率增长方向计算系统的负荷裕度,势必带来沉重的计算负担,难以适用于大规模电力系统电压稳定评估效率的需要。

静态电压稳定域(static voltage stability region,SVSR)是描述确定网络拓扑结构和参数下,系统具有静态电压稳定性的运行区域。与CPF相比,SVSR可在给定功率增长方向上的基础上,研究电压稳定关键节点的注入功率随机性变化对系统电压稳定性的影响,描述了系统当前运行点到不同功率增长方向下电压稳定临界点之间的距离,可更直观、真实地评估系统的电压稳定性。

3

论文所解决的问题及意义

SVSR虽可全面、直观评估电力系统在多重不确定性和随机性因素影响下的电压稳定性,但SVSR边界的搜索是构建SVSR的关键。目前, VSR边界搜索方法以拟合法和超平面近似最为常用,拟合法基于“离线计算、在线应用”原则,针对系统可能的功率增长方向,重复调用CPF进行大量离线计算以获取鞍节分岔(saddle node bifurcation,SNB)点集,进而由这些SNB点集构成SVSR边界。由于CPF具有良好的计算精度,因此,采用该方法搜索所得SVSR边界精度较高。但随着系统互联规模不断扩大、可再生能源大规模接入,使得CPF的计算规模和重复调用次数急剧增加,加重了CPF搜索SNB点的计算负担,导致离线计算时间过长,极大恶化了SVSR的构建效率。超平面近似法不再对SVSR边界上的SNB点进行逐点求解,而是寻找与真实SVSR局部边界足够接近的超平面,采用一个或多个超平面局部近似SVSR边界,以提高SVSR构建效率。然而,超平面近似精度受SVSR局部边界曲率影响较大,当SVSR局部边界曲率较小时,超平面近似可获得良好的精度;当SVSR局部边界曲率较大时,超平面近似难以保证其近似的准确性。此外,SVSR边界拓扑特性极为复杂,难以用统一的超平面解析式描述或获取准确近似的通用性结论。因此,有必要深入研究准确、快速、高效的SVSR构建方法,提高大电网电压稳定态势感知能力。

4

论文的方法及创新点

为实现电力系统SVSR的准确、快速、高效构建,本文依据电力系统SVSR边界的拓扑特征,提出一种电力系统静态电压稳定域边界快速搜索的优化模型,该优化模型针以SVSR边界上已知SNB点为初始点,搜索下一待求SNB点,不仅继承了传统OPF模型高精度搜索SNB的特点,还有效降低了传统OPF搜索单个SNB点的耗时,显著提高了电力系统SVSR构建效率。

图1 基于本文所提优化模型的SVSR边界搜索示意图

采用本文所提优化模型搜索系统SVSR边界的具体过程如图1所示,首先设定功率增长方向角为b0的初始功率增长方向d0,以基态O点为初始点,取l=1,采用传统OPF求得功率增长方向d0所对应的SNB点0,其状态变量为(x0, l0)。改变d0中对应于节点i、j有功注入增长的分量,形成新的功率增长方向d1=[0,…,,0,..,0,,0,…,0]T,其对应的功率增长方向角b1=b0-Δb。设置初值h01=1,将SNB点0的状态变量(x0, l0)带入本文所提优化模型,求解得功率增长方向d1所对应的SNB点1,其对应的状态变量为(x1, h1),进一步得SNB点1所对应的负荷裕度l1=h1l0。以SNB点1为初始点,(x1, l1)为初始值,令h02=1,采用本文所提优化模型搜索功率增长方向d2下的SNB点2。以此类推,重复上述操作,可实现图中SNB点0至4的搜索。类似图中SNB点0至4的搜索方法,采用本文所提优化模型可进一步实现SNB点1-、2-的快速搜索,进而完成节点i、j二维有功功率注入空间第一象限内完整SVSR边界的搜索。

5

结论

本文提出一种基于优化模型快速搜索电力系统静态电压稳定域的实用化方法,通过WECC 3机9节点系统、IEEE-118节点和UCTE系统对所提方法的有效性、准确性和实用性进行分析验证,相关结论如下:

1)本文所提优化模型可实现二维及高维有功功率注入空间中电力系统静态电压稳定域边界的快速搜索。

2)相比基于CPF的静态电压稳定域构建方法,本文所提方法构建的SVSR边界具有更高精度。

3)相对基于CPF、OPF的静态电压稳定域构建方法的计算效率,本文所提方法大幅降低了电力系统静态电压稳定域构建的计算时间,显著提高了电力系统电压稳定域的构建效率。

4)本文所提电力系统静态电压稳定域快速搜索优化模型可应用于实际电力系统的电压稳定域构建,可有效提高大电网电压稳定态势感知能力。

本文引用

姜涛, 张明宇, 崔晓丹, 李勇, 石渠. 电力系统静态电压稳定域边界快速搜索的优化模型[J]. 电工技术学报, 2018, 33(17): 4167-4179. Jiang Tao, Zhang Mingyu, Cui Xiaodan, Li Yong, Shi Qu. A Novel Optimization Model to Explore Static Voltage Stability Region Boundary in Bulk Power Systems[J]. Transactions of China Electrotechnical Society, 2018, 33(17): 4167-4179.

作 者 简 介

东北电力大学

东北电力大学李国庆教授科研团队依托“电力系统安全运行与节能技术”国家地方联合工程实验室,主要开展电力系统安全性与稳定性分析、电力系统优化调度、柔性直流输电技术、可再生能源集成、输变电设备运行状态监测与故障诊断、电能质量、综合能源系统等领域的科研工作。团队拥有教授3人、副教授9人,讲师3人;博士生导师3人,硕士研究生导师14人;团队有9名成员分别在田纳西大学(UTK)、北卡罗莱纳州立大学(NCSU)、北卡罗莱纳大学夏洛特分校(UNCC)、麦吉尔大学(McGill University)等国外高校和科研机构留学与研修一年以上;先后培养博士研究生12人,硕士研究生300余人。

近年来,团队承担国家重点研发计划项目、国家自然科学基金重点项目、国家自然科学基金项目和吉林省“双十工程”重大科技攻关项目等国家、省部级科研项目40余项;承担国家电网公司、南方电网公司、发电集团等科技项目100余项。获国家科技进步奖二等奖2项、省部级科技进步一等奖4项、省部级科技进步二等奖10项、省部级科技进步三等奖2项。发表论文400余篇,其中SCI/EI期刊论文300余篇,ESI高被引论文6篇;获授权发明专利24项,公开发明专利50余项。

姜 涛男,博士,副教授,博士生导师,美国北卡罗来纳州立大学、田纳西大学、瑞典马拉达伦大学访问学者,国家留学基金委“2017国际清洁能源拔尖创新人才培养项目”入选者,天津大学优秀博士学位论文和IEEE PES GM 2016最佳会议论文获得者,主持国家自然科学基金青年和面上项目各1项,承担国家重点研发计划项目课题1项,发表SCI/EI期刊论文60余篇,其中ESI高被引论文5篇,获吉林省科技进步奖1项,出版专著1部。主要研究方向为电力系统安全性与稳定性、可再生能源集成、综合能源系统。

010-68595315(编辑)

010-68595053(编辑)

Excel教程 更高效的搜索式下拉菜单 你一定要懂

工作中大家经常会用Excel数据验证制作下拉菜单,规范数据输入、节省数据输入时间。但是当下拉菜单的数据选项很多的时候,就会出现数据难找的困扰。比如下图,下拉菜单中的数据选项太多,通过拖动旁边的滚动条来“找出”需要的数据项很费时,直接降低了我们的工作效率。

那有没有办法解决这种选项多数据难找的问题呢?

有,我的方法就是搜索式下拉菜单!

就如同在百度上搜索,输入关键字后会弹出下拉菜单显示包含关键字的搜索题目供选择。我们要做的效果就是在单元格中输入关键字,然后点击下拉菜单,菜单中只显示包含关键字的数据,从而提高数据录入效率。

下图是我们本次教程的数据源(要Excel课件同步操作练习,请到QQ群:316492581下载)。注意,必须对数据源按关键字排序,升序降序都可以。

选择E2:E6单元格区域点击【数据】选项卡,单击【数据验证】,在弹出的“数据验证”对话框的“设置”选卡中设置验证条件为“序列”。

在来源中输入公式:

=OFFSET($A$1,MATCH(E2&”*”,$A$2:$A$17,0),0,COUNTIF($A$2:$A$17,E2&”*”),1)

公式说明:

这里主要使用OFFSET函数返回包含关键字的数据。OFFSET函数的作用是根据指定的参照单元格,通过给定的偏移量返回新的引用数据。

OFFSET(参照系,行偏移量,列偏移量,新引用区域的行数,新引用区域的列数)

1.第一参数引用了A1单元格作为参照系。

2.第二参数用MATCH(E2&”*”,$A$2:$A$17,0)确定行偏移量。MATCH为查找函数,根据查找值E2&”*”(*号是通配符,代表任意不确定字符)在$A$2:$A$17区域中查找,查找方式为0(精确查找)。当E2单元格输入关键字时,该函数将查找出包含关键字的数据在$A$2:$A$17区域中第一次出现的位置。

3.第三参数为0,因为我们的数据源只有A列一列,所以列偏移量为0,表示不偏移。简单来说,就是offset函数以A1单元格为参照,不横向偏移,只向下偏移。

4.第四参数 COUNTIF($A$2:$A$17,E2&”*”)统计A2-A17区域内满足条件E2&”*”,也就是包含E2单元格内的关键词的单元格出现的次数,也就是最终在数据验证下拉菜单中一共会出现几行。

5.第五参数为新引用区域的列数,因为只有A列一列,所以为1。

如下所示:offset函数以A1为参照系向下查找,通过match函数在A2-A17中找到包含E2关键字“碎花”的数据第一次出现的位置是从A2开始的第10行,再通过countif函数找到总共有3行,最终在下拉菜单中返回这3行1列的数据。

再回到教程当中。我们在“数据验证”对话框“来源”中输入公式后点击“确定”。但是当我们在E2单元格输入关键字“碎花”后,会立马弹出警告框,这是为什么呢?

原因是我们输入关键字“碎花”后,由公式得到的下拉菜单中没有只含“碎花”两个字的选项,所以会报错。

如下图所示,我们需要再次选择E2:E6单元格区域点击【数据】选项卡【数据验证】按钮进入到“数据验证”对话框中,在“出错警告”选卡中取消勾选【输入无效数据时显示出错警告】选项,然后点击“确定”即可。

最后在F2单元格输入公式=IFERROR(VLOOKUP(E2,$A$2:$B$17,2,0),””) 。使用VLOOKUP函数在A2-B17单元格区域中查找E2数值所在位置,并返回对应的第2列(也就是B列)库存,0代表精确查找。当查找不到返回错误值时用IFERROR函数将错误值转为空。

至此,搜索式下拉菜单就制作完成啦!

搜索式下拉菜单可以成倍提高数据录入效率,尤其是下拉菜单选项很多的时候特别高效。同学,赶紧打开你的excel去操作一下吧。

加雪儿微信,免费领取Excel技巧视频学习

想全面系统学习Excel,不妨关注部落窝教育《一周Excel直通车》视频课或者《Excel极速贯通班》直播课。

2018百度搜索榜首年度关键词:世界杯 流行语:sk

近日,百度正式发布了沸点国人年度榜单。通过八个不同的子榜单,百度向人们展示了过去一年中中国人关心的是什么。这其中,苹果发布会登顶了全民热议榜单。

今年百度App沸点榜单设置了:年度国内事件、年度国际事件、年度国民骄傲、年度泪点、年度关键词、年度人工智能关键词、年度全民热议、年度流行语8个子榜单,共计涵盖80个热门话题。8个子榜单首位的分别是:台风山竹、中美贸易争端、中继星鹊桥发射、汶川地震十周年、世界杯、机器人、苹果发布会、skr。

以下为2018百度App沸点国人年度搜索榜单详情:

年度国内事件:台风山竹、改革开放40周年、长生疫苗事件、港珠澳大桥通车、全面取消限迁政策、身份证新规施行、央行开出亿级罚单、个税起征点上调、第四套币停止流通、中国台湾花莲地震

年度国际事件:中美贸易争端、俄罗斯世界杯、哈里王子大婚、Facebook数据泄露、普京开启第四任期、安南去世、国际原油价格下跌、韩朝历史性会晤、哥伦比亚加入北约、沙特承认记者死亡

年度国民骄傲:中继星鹊桥发射、S8赛事IG夺冠、苏炳添6秒55、亚运会奖牌第一、港珠澳大桥通车、武大靖破世界记录、国产航母出港、人造太阳1亿度、最高成就奖邹市明、一箭六星发射成功

年度泪点事件:汶川地震十周年、李咏去世、重庆公交坠江事故、金庸去世、重庆幼儿园伤人事件、山东寿光洪灾、霍金去世、单田芳去世、斯坦李去世、小红莓主唱去世

年度关键词:世界杯、中美贸易争端、台风山竹、苹果发布会、延禧攻略、创造101、skr、李咏去世、锦鲤、电竞

年度人工智能关键词:机器人、芯片、物联网、智能音箱、自动驾驶、人脸识别、量子计算、无人车、世界人工智能大会、量子力学

年度全民热议:苹果发布会、崔永元炮轰范冰冰、刘强东性侵风波、乘网约车遇害、高铁“霸座”事件、昆山反杀案、逃犯克星张学友、抵制天价片酬声明、王思聪开奖、D&G辱华

年度流行语:skr、佛系、大猪蹄子、小奶狗、小姐姐、钢铁直男、C位出道、渣渣辉、真香、官宣体。

来源:百度、中关村在线,登载只为传递更多信息。

快讯·中国搜索《民族品牌成长计划》07月29日聚焦-广东广州

—国家平台成就国家品牌

中国搜索作为具有国务院新闻办公室颁发的新闻信息的采集发布资质的中央新闻网站、国家搜索平台;自4月1日起,中国搜索依托强大媒体资源优势启动“大国品牌推介工程”计划在绿色农业、制造业、食品饮料、家具家居礼品、电商等多个行业各选择数家优秀企业,作为重点推介对象,进行品牌形象打造;融合CCTV电视节目展播、搜索广告、新闻软文报道、高端人物访谈,PC+移动的全方位推广,帮助潜力企业增强品牌实力、提升品牌内涵、彰显品牌魅力,唱响中国品牌,为中国民族企业走向世界铺路架桥。

目前中国搜索已经覆盖了全球200多个国家和地区,并拟计划于今年买内投入5亿元用于市场宣传。2018年中国搜索“民族品牌培育成长计划”暨广东省企业优选活动将于07月29日下午在广州白云国际会议中心隆重召开,届时将邀请广东100余位中小企业家共襄盛事!

据知,中国搜索致力于成为掌握权威信息搜寻、紧跟科技发展步伐、服务多方受众需求的国家级搜索引擎

该搜索负责人介绍,中国搜索着力研发新一代信息技术,运用数字化、网络化、大数据、云计算等信息化新技术,秉承多媒体信息搜索、聚合、互动、传播新理念,通过自主创新和广泛合作,创新信息化应用服务,打造国家级先进网络文化传播平台,增强中国声音传播能力,提高服务党和国家工作大局和经济社会发展水平,丰富社会大众精神文化生活。

为了促进传统企业与互联网更全面、更高效的融合,中国搜索现已面对全国中小微企业开放!去年8月底,中国搜索华南区负责人透露中国搜索将加快线下推广的步伐,让更多的消费者使用中国搜索,也让更多的中小企业认识中国搜索,依拖中国搜索实现产业的转型升级。广告投放将全面覆盖公交、地铁、高铁等。2018年中国搜索“民族品牌培育计划”暨广东省企业优选活动将于07月29日下午在广州白云国际会议中心(4号楼·3楼河源厅)隆重召开,这对广东省中小企业而言,无疑将会带来一波新的互联网红利,必将惠及广大企业及亿万大众。

淘宝的搜索权重是怎么一回事

2019年了,大家都说淘宝是越来越不好做了,我之间有几篇文章写了一些关于淘宝店铺的小知识,现在我再给大家讲解一下什么是搜索权重,以及我们怎么去提升这个淘宝店铺的搜索权重。

首先中企网先给大家讲解一下什么是搜索权重。

打个比方,就是比如说你要去买一件衣服,那么这个衣服是夏天穿的短袖,黑色,那么这个“黑色”“短袖”就属于一个关键词,在淘宝买衣服的人通过这些关键词去搜索,淘宝根据消费者的需求,会匹配到最优质的类目推荐到搜索的人面前。

那么如何去获取更多的手淘搜索权重呢?

1坑产值权重

就是搜索关键词的坑位产出,我们也叫它UV价值,你像之前2016年的时候,风靡一时的大金额黑搜就是这个权重引发的,当然我们不排除现在还有人这样做,但是基本上都会被官方去限制,间接说明了这个坑产值这个权重还是存在的。

2点击率权重

淘宝给你的是展现量,如何能在众多宝贝当中获得消费者的欣赏,所以主图的点击率是非常重要的一个权重,基本的操作思路就是差异化图片,根据竞争对手的人家都用白底,你就用黑底,人家都是深色,你们就用浅色,别人用整体图,你们用局部图。

3转化率权重

这个转化率指的是搜索关键词的转化率,我们通过生意参谋商品分析关键词的的来源找到关键词的成交量,以及关键词的流量,大概计算出关键词的转化率,当然这个是大概的估值,如果有一定的参考意义,根据竞争对手的数据,如果我们要做的更好大概是竞争对手的1.5倍到2倍,太高了容易出问题。

4收藏加购权重

这个权重是人气排行的一个关键指标,人气指数是根据目前很多的手淘首页流量的一个判定标准一句,喜欢你宝贝的人越多,你获取手淘首页的流量的概率越大。

这这里中企网给大家介绍个小技巧啊,如果大家不知道自己的产品适合哪个类目,那么不妨参考其他卖家,也就是看谁和你卖一样的产品,卖的最好的商家就是你产品类目的所在,比如说你可以去搜索中企网女装,复制你的链接去到淘宝诊断,那么就很容易看出,别人的产品放在什么类目,那么我们就很容易跟随着放这个类目了。

搜索竞价推广被定义为 广告 带来的影响

根据最新消息,某官方认定搜索引擎竞价推广皆为“广告”。这则看似一条简单的官方规定似乎并不影响各媒体竞价排名推广,但是搜索界却要引起轩然大波。快投365SEM认为当搜索引擎竞价推广被定义为“广告”,主要会带来以下两点影响:搜索竞价推广被定义为“广告”带来的影响

  1. 对企业:行业整体点击率下降快投365百度竞价软件小编认为自从上次魏则西事件之后,用户对于互联网竞价广告有了新的认识。充分了解到百度推广首页哪些是广告。这次官方说明后,势必导致用户点击竞价排名的点击率降低,从而直接搜索自然排名结果。行业整体点击率势必下降。如何补救账户点击率下降带来的损失,将成为搜索引擎竞价推广的重要难题。
  2. 对用户:识别有用信息更加重要以前习惯了搜索一个内容,最先看到什么内容就点击什么内容。但是现在不一样,用户是不喜欢广告的。所以在搜素引擎搜索时如何找到自己想要的信息非常重要。通常来说百度自有产品:百度知道,百度经验,百度百科这块还是非常可靠的,广告性文字很少。搜素引擎竞价排名现在越来越被大众所了解,百度更是为了用户体验将广告位缩减到4个,市场竞争更加激烈。所以在这样的网络营销环境中,学习更多的营销技术将会变得越来越重要。 本文来自快投365百度竞价软件站www.kuaitou365.com

谷歌应用现怪异Bug 搜索特定词条会暴露短信

过去几周里,有安卓用户在其设备上发现了前所未有的有趣bug。当用户在搜索一些特定词条时,设备会暴露用户个人的短信息。不过这个bug只会在使用Google Search,Google Assistant以及Pixel Launcher这些谷歌应用时才会触发。

这个问题最初由一位用户报告,据称当他偶然在Google Pixel Launcher中搜索“the1975..com”时,该应用并没有返回搜索结果,而是返回了所有短信。之后这位用户在Reddit上发帖公布了这个bug的细节,其他用户和研究人员发现通过其他词条(如下),在其他谷歌应用中也可以重现这个bug。

the1976..com

thw1975..com

the1975..com

the1974..com

Vizel viagens

Izela viagens

Zela viagens

谷歌应用通常是可以返回短消息的,但是也仅限于在用户明确指示后才会显示,而不是通过搜索这些随机词条显示。Google Assisant很久之前就可以朗读短信了,这提高了谷歌通过一些模糊词返回相同结果的可能性,

虽说这称不上是个安全风险,但是它比安全风险更加“怪异”。因为除非有人可以接触到你的手机,否则无法利用这个漏洞,再者,如果真的有人可以访问你的手机,他可能更倾向于直接打开你的短信应用程序查看短信,而不是打开谷歌应用搜索这些奇怪的词条。不过即便如此,你也可以通过禁止Google应用访问短信或设置锁屏来确保隐私不被窥探。

谷歌表示这是“语言检测”出现问题,即将相关词条理解为读取短信,目前谷歌已经解决了这个问题,且谷歌商店中已经可以获得更新后的Google Search,Google Assistant以及Pixel Launcher。这个bug并不是在所有安卓手机上都有,但是所有Pixel智能手机似乎都会受到影响。

*参考来源:bleepingcomputer,techrepublic,Covfefe编译,来自:FreeBuf.COM

网络付费搜索被定性为广告后,还有哪些难题待解?

提要:国家工商总局出台新规明确网络付费搜索为“广告”,但执行层面的一些难点仍需攻破。比如,互联网搜索信息服务提供者、广告发布者对广告内容审核时,到底是只需审核广告点击页面的链接,还是需同时审核链接跳转之后的落地页面,甚至是再跳转的其他跳转网页,仍亟待解决。

《财经》记者 肖辉龙

7月8日,国家工商总局在官网公布《互联网广告管理暂行办法》(下称《办法》),首次将互联网付费搜索定性为广告,并明确将于2016年9月1日起施行。

自今年4月魏则西事件发酵,关于搜索信息服务提供者的竞价排名付费推广究竟属于信息检索服务还是属于广告的争议,曾引爆舆论。

过程中,无论是国家网信办联合调查组对涉事百度公司的调查结论,还是6月25日国家网信办颁布的《互联网信息搜索服务管理规定》(下称《规定》),都没有对付费排名搜索进行法律定性。

《办法》对这一问题进行了明确。其规定,今后所有付费排名搜索服务都将被明确标注“广告”,以便区别于自然搜索,减少对用户的误导。

业内人士表示,《办法》回应了舆论关注的热点问题疑问,也明确了互联网广告产业中各方主体的权利与义务,对于网络广告生态系统的良性发展具有积极指导意义。但在广告跳转链接的审核、如何细化执行等问题上,《办法》仍未明确。

《办法》总计29条,其第17条规定,互联网信息服务提供者对其明知或者应知利用其信息服务发布违法广告的,应当予以制止。

阿里巴巴移动事业部法务副总监孟洁参与了《办法》企业意见反馈,她向《财经》记者介绍称,广告审核包括对广告主的资质审核与广告内容审核。“不管是新《广告法》还是网信办出台的《规定》以及工商总局的《办法》,都没有对需审核的广告链接层次和范围进行明确界定。”

孟洁表示,互联网搜索信息服务提供者、广告发布者对广告内容审核时,到底是只需审核广告点击页面的链接(又称广告物料,业内俗语),还是需同时审核链接跳转之后的落地页面,甚至是再跳转的其他跳转网页,这仍是亟待解决的问题。

目前业内有两种主要观点:一种认为,广告是信息搜索服务提供者或广告发布者引进,应对广告所有跳转页面内容进行审核,其责任不能仅限于广告物料内容;另一观点认为,信息搜索服务提供者或广告发布者只是提供或发布了广告链接,且在提供或发布时已对广告物料页面进行过审核,如果再发生跳转,就不应再由其负责,因为链接页面可以无穷跳转,广告物料页面多次跳转后,上述两方主体会因此失去控制权。

孟洁表示,这一问题暂时主要靠行业自律来约束规范,但业内也有一些措施能对这类行为形成一定约束力。比如黑名单机制,一但广告主被查,互联网搜索信息服务提供者和广告发布者将停止为其提供服务;另外还有巡查机制,有的广告发布者会专门检查已经投放过的广告物料页面,审核有没有被恶意修改等行为。

但终究互联网广告具有海量特性,而执法机关工作人员数量有限,在互联网广告的审批环节和监管环节都会存在二者不匹配的矛盾,如何有效解决这一矛盾问题,也将成为影响行业规范执行的关键因素。

曾参与《办法》起草的中国政法大学传播法研究中心副主任朱巍也向《财经》记者表示,《办法》对广告主和广告经营者等主体的管理界定和各部门如何协调辖区监管职能的分工机制,都表现出是一个多层次的联合监管体系。

他同时表示,《办法》只是一个部门规章,它的法律效力有限,其积极意义在于能对行业规范有指导意义,也能作为行政处罚依据,但要是上升到司法实践,这类规章和政策性文件,就不能作为司法判决的基础,而只能作为参考。所以,今后也可能会出现具体司法实践与行政执法存在偏差的案例。

孟洁介绍,此部门规章出台前,曾广泛征求了包括腾讯、阿里巴巴、百度、搜狗等互联网企业的意见。

《办法》出台后,百度和搜狗等互联网搜索信息服务企业都向《财经》记者回应称,将积极拥护和执行新规。

搜索广告不是新事物 小程序版的卖点在哪

微信小程序之所以被大家如此看重,我想一方面是因为它选择在iPhone发布十周年的大日子上线,寄托了腾讯致敬创新的厚望,另一方面是因为小程序从去年提出概念开始,就被外界一直解读为要革掉APP的命,可能会为不同行业带来很多创新。从正式上线到目前的情况来看,小程序的确可能会为“互联网+”提出蓝海新航向,为各行业应用带来新希望。

自3月份以来,微信团队不断尝试优化、调整小程序的相关功能。在公众号可以关联小程序、开放“附近的小程序”功能后,微信又为小程序的进化图添了新的一笔:小程序搜索广告上线。

6月16日开始,已经有部分用户发现在小程序入口搜索特定关键词,从搜索结果中可以看到置顶的广告品牌。

如图显示,搜索“酒店”、“机票”等关键词,付费配置了对应品牌词的广告主小程序会在置顶位置展示,同时微信也会给其标注“广告”标签,用以区别于普通关联的小程序。

1、小程序搜索广告背后的价值逻辑

对于小程序上线广告服务,微信团队的回应是:“小程序关键词推广功能正在试点,开放时间未定。已被灰度到的用户可通过搜索试点小程序开发者配置的品牌词和服务词,找到它的小程序或者相关服务。”

小程序搜索广告服务的使用逻辑是:用户可以通过搜索场景关键词,在不知道小程序准确名称的情况下,模糊搜索出潜在可以提供服务的小程序。

微信搜索场景开始直接对接小程序的服务能力,帮助小程序开发者在现有微信场景中找到并使用适合触达用户的场景。这是针对小程序开发者的服务,使其可以观测到哪一类人群对小程序服务真正感兴趣,帮助优质小程序更好地浮现。

至于用户侧的服务,搜索产品对于用户的核心价值是信息和服务。微信在搜索功能上的扩展和优化是随着数次更新循序渐进的,而非一步到位。 其实不难理解微信的“克制”,据最新数据,微信和WeChat的合并月活跃账户数已达到9.38亿,庞大的基础用户群,使微信不得不把落点放在用户需求上,背在身上的包袱自然也是沉重的。

2、搜索广告不是新事物,小程序版的卖点在哪?

当听说小程序上线搜索广告服务,旁观者的反应惊人得一致:小程序竟然要抢百度的饭碗,活着不好吗?

诚然,广告竞价搜索早已不是新事物。尤其是类似百度的商业竞价搜索,一般是以“价高者第一”的逻辑排放广告,用户搜索关键词得到的结果信息,不一定能精准契合关键词广告。而且这一类的竞价搜索也无法保证广告的质量,黑广告的出现无法避免,一度引发社会反思的“魏则西事件”,就是无节制黑广告的例证。

那么小程序内的广告竞价搜索和一般商业竞价搜索模式又有何不同?

在小程序诞生之初,微信团队就曾指出小程序是重新连接用户和服务,服务可能正是核心,这与一般商业竞价搜索的“以广告买主为中心”、服务广告主有所不同。毕竟是拥有9.38亿的月活用户,微信小程序推出搜索广告自然也是在庞大的用户群中看到了需求。

PC时代PC端的搜索重点在信息,而移动时代移动端的搜索则侧重服务。在2016年底的微信公开课上,张小龙曾给小程序定下即用即走、不做分发的基础原则,这意味着小程序不会出现类似“排行榜”的分类、排行、推荐模式,长尾应用也就能获得更多的展示应用。与传统搜索“用钱买通一切”的思路不同,微信在“小程序自定义关键词”(同样也是用于搜索小程序)功能出来的时候也说到,小程序的服务质量、用户使用情况、关键词相关性等因素,将会共同影响搜索结果。

相对于一般的搜索服务,小程序内的广告搜索服务可以基于微信社交关系传播,这是微信自身优势的补充。此外,如果用户使用过,就会出现在“使用过的小程序”里,这也是一个比较体贴的更新。按微信一贯的理念,透支用户体验满足小程序商业化的可能性几乎没有,这种严谨的商业化实验反而会整体增强小程序和微信的体验。至于对广告信息异常敏感的互联网用户,对这次微信的新功能会不会买账,也只有静观其变了。

百度移动搜索建站优化白皮书(全文)

1 前言

手机百度是一款有6亿用户在使用的手机搜索客户端,在中文用户信息获取上发挥了不可替代的作用;移动搜索引擎每日分发上亿流量给到优质安全网站,来满足用户的搜索需求;而对于广大的站长来说,优质安全的网站有助于在搜索引擎中获得良好的排序和展现,从而吸引更多用户,获得更多流量。

移动搜索引擎优化,指从建站开始到吸引用户,贯穿所有流程,为了让百度搜索的重要合作伙伴——广大站长充分了解百度搜索引擎规则,并根据规则合理安全建设网站、优化网站,更好的获取搜索流量;百度搜索资源平台历时3个月,探访搜索内部各个技术部门,将百度搜索内部技术原理抽丝剥茧,化零为整,整理出《百度移动搜索建站优化白皮书》,希望与各位站长携手,为用户提供一个健康安全高效的搜索环境。

2 网站建设

2.1 域名选择

网站域名选择,不仅能快速直观让用户了解网站定位,域名设置,更会影响搜索对网站的抓取情况。因此,选择简单好记且安全的域名,是网站搭建前期最重要的一步。

2.1.1 域名选择的注意事项

网站搭建之初,对网站域名选择,建议域名独立,简单好记;独立移动站域名选择也遵循此规则。

移动站的域名需与PC站域名分开,移动站不建议与PC站公用一个域名;比如PC网站域名建议是www.test.com,对应移动站的域名是m.test.com,而不是www.test.com/m/的形式;如果是自适应网站可不考虑此情况。

网站域名选择中,主要有以下两点建议:

√ 建议使用比较常见的域名后缀,如.com\.cn\.net等;

√ 如果网站追求个性化使用罕见域名后缀,为了保证搜效果,请来百度搜索资源平台(原百度站长平台)进行站点验证。

2.1.2 使用子域名或目录

网站是否需要建立子域名,或是划分多级目录,可根据网站自身定位及网站内容量级决定。通常来说,综合类或内容量较多的网站,可将内容按照不同二级域明确划分;而如果网站内容较少,不建议网站开设过多的子域名。

举例来说,blog形式站点,有的网站给到每个blog作者单独的三级域,但如果作者发布频率较低,整个三级域都是更新频率很低的状态,过低的发布频率对搜索引擎来说是不友好的。

2.2 内容发布系统

内容发布系统,无论是网站自建还是使用第三方建站系统,百度都是支持的;所有发布系统,除遵循有条理、逻辑清晰建站,还要注意网站搭建的安全问题,避免网站安全隐患,才能更好的提升网站价值。

2.2.1 自建内容发布系统

网站自建内容发布系统,注意事项包括:

√ 主体内容清晰且能够很好的识别与分辨;

√ 后台发布时间切勿自行设置,遵循发布时间与展示时间一致;

√ 内容发布系统中各表单设置合理,如对tag标签的设置不宜过多、不宜罗列关键词;

√ 分类划分明确,分类主题的文章对应发布到相应分类下;

√ 题文相符,切勿挂羊头卖狗肉,欺骗搜索引擎流量,损伤用户体验;

√ 段落清晰合理、字体大小适中、字体颜色切勿使用与背景色相近的颜色;

√ 发布内容目录划分清晰,具体参考2.3章节中网站结构设置。

2.2.2 第三方发布系统

使用第三方发布系统建站,需要站长关注以下注意事项:

√ 模板主题不建议频繁更换;

√ 类似wordpress等系统,不建议使用过多插件,会影响网页打开速度;

√ URL伪静态的处理,命名规范、层级清晰;

√ 开源建站系统存在较多安全隐患,使用过程中务必做一些安全上的设置和优化。

2.2.3 页面生成规范

无论网站自建发布系统,还是网站使用第三方建站系统,网站页面的生成,都应注意以下几点:

√ 网页结构清晰、各分类名称设置醒目;

√ 导航、面包屑导航设置合理,机器可读、位置突出,用户能很好得知所访问页面在网站中的位置;

√ 不存在遮挡主体内容的广告元素;

√ 无三俗图文、音频元素;

注意网站搭建系统安全问题,杜绝网站安全隐患。

访问请求中的content-type需要根据对应的类型进行正确设置,图示如下:

除此之外,关于页面规范标准,建议参考搜索学院发布的《百度搜索Mobile Friendly(移动友好度)标准V1.0》

2.3 网站结构

合理设置网站结构,是网站被快速抓取、获得搜索流量的基础;因网站结构设置不合理,导致网站无法被快速识别抓取的事例在百度日常反馈中经常见到,且网站换域名也会对网站造成一定损失,故希望各位站长从建站之初重视网站结构设置,避免不必要的损失。

2.3.1 URL结构设置

URL搭建是否有严格要求,请看以下几点注意事项:

√ 在搭建网站结构、制作URL时,尽量避开非主流设计,追求简单美即可,越简单越平常,越好,例如URL中出现生僻字符,如不常见的“II”,会引起搜索引擎识别错误;

√ URL长度要求去掉协议头http(s)://之后的URL长度不要超过256个字节;

√ 谨慎使用#参数,有效的参数不能放在#后面;可能被截断导致网页抓取异常。

2.3.2 目录结构设置

网站目录结构搭建是否合理,影响搜索引擎对网站的抓取情况,这里需要提到的是,网站目录结构无论是扁平化还是树形结构,一般都可以被搜索引擎发现,但有以下几点注意事项:

√ 建议不同内容放在不同目录或子域下,域名划分在2.1.2网站域名划分章节中有详细提到;

√ 不要使用孤岛链接,孤岛链接很难被搜索引擎快速发现;若网站已存在大量孤岛链接,建议使用搜索资源平台的链接提交工具向百度提交数据;

√ 重要内容不建议放在深层目录,若该内容没有大量内链指向,搜索引擎很难判断该页面的重要程度。

以下是图片示例:

2.4 服务商/自建服务器

选择服务商或者自建服务器,对网站搭建都是十分重要基础的一环;服务器安全和稳定将直接影响百度搜索引擎对网站的整体判断。

2.4.1 域名服务

2.4.1.1 域名服务&域名部署

关于域名服务和域名部署,有以下注意事项:

√ 站长在域名部署中请仔细各环节问题,不要出现域名部署错误情况;

√ 不建议网站进行泛解析,若网站爆发大规模泛解析,且影响恶劣,则会受到搜索策略打压;

√ 尽量选择优质域名服务商。

2.4.2 服务器

做网站还有非常重要的一环,就是服务器的选择,那服务器选择中,无论是虚拟主机、云主机还是独立的服务器,都应该注意以下四点:

√ 中文网站不建议选择国外服务器;

√ 服务器的稳定性非常重要,需要保持访问流畅,服务器是否稳定,可以使用百度搜索资源平台(原百度站长平台)抓取异常、抓取诊断工具进行检测维护。(服务器经常无法访问或者死机,对爬虫来讲都是致命伤害);

√ 服务器选择除了自身的稳定性外,实际上还要考虑网站的业务量,例如带宽、内存、CPU是否能够承受访问量,突发大流量情况下是否可以正常访问;

√ 服务器主机设置,需要注意是否有禁止爬虫抓取的设置、或存在404错误信息设置,这些情况都会引起不必要的搜索引擎抓取判断异常,为网站带来不必要的损失。

2.4.2.1 虚拟主机

总的来说,建议虚拟主机选购时候需要特别注意:

√ 主机商是否存在限制搜索引擎访问的情况;

√ 主机商的资质是否符合要求;

√ 主机商的技术沉淀是否足够,建议选择品牌较大的主机商;

√ 主机商托管的机房的物理条件和网络条件是否足够优秀;

√ 主机商的技术和客服支持情况是否够好;

√ 主机商是否会存在超容量的情况;

√ 主机商是否存在违规接入高风险站点的问题或同一IP下是否会存在高风险站点的情况;

√ 国内站点建议选购国内云主机建站。

2.4.2.2 独立主机

独立主机为站点带来更加宽松的使用环境和个性软件的安装,因此独立主机需要站长拥有一定的技术力量来保证网站的正常运行和安全。

我们对于站长选购和托管独立主机的建议是:

√ 注意虚拟主机是否有将爬虫IP拉入黑名单,关于百度UA,可以参考3.1.2.1百度蜘蛛章节;

√ 建议使用独立IP地址的主机;

√ 建议使用规模较大机构的主机,在安全配置、稳定性上相对更好;

√ 对IDC服务商的建设标准需要一定的考虑,例如防火、防盗、是否有UPS保证、室内温控、消防等;

√ IDC服务商的服务质量和技术是否达标,是否24h值班,是否能够协助排查一些故障、免费重启重装系统等;

√ IDC机房的资质是否齐全,存放站点是否有高风险站点或服务器存在。

2.4.3 安全服务

2.4.3.1 HTTPS

当前百度已实行全站化HTTPS安全加密服务,百度HTTPS安全加密已覆盖主流浏览器,旨在用户打造了一个更隐私化的互联网空间、加速了国内互联网的HTTPS化。同时也希望更多网站加入到HTTPS的队伍中来,为网络安全贡献一份力量。

HTTPS安全原理解析

HTTPS主要由有两部分组成:HTTP + SSL / TLS,也就是在HTTP上又加了一层处理加密信息的模块。服务端和客户端的信息传输都会通过TLS进行加密,所以传输的数据都是加密后的数据。

HTTS复杂的加密机制有效的加大了网站的安全性,加密机制与认证机制可以减少网站被劫持和假冒的风险,建议站长们可以通过做HTTPS改造来强化网站安全。

百度搜索资源平台为了更好的抓取识别HTTPS网站,2017年还推出了HTTPS认证工具,已经完成HTTPS改造的网站,可以在搜索资源平台-网站支持-HTTPS认证工具中提交网站的HTTPS数据,便于百度更好抓取识别网站。关于HTTPS认证工具详解,可以参考5.3.2HTTPS认证工具章节。

2.4.3.2 网站防止被黑对策

网站被黑,通常表现为网站中出现大量非本网站发布的类似博彩内容,或网站页面直接跳转到博彩页面;以下是网站被黑后发布的内容:

内容非网站发布,内容中含大量博彩网站指向:

网站页面直接跳转到博 彩 网 站

网站被黑代表网站安全存在严重问题或漏洞,如何防范网站被黑,请参考以下:

首先,自查是否被黑

√ 被黑网站在数据上有一个特点,即索引量和从搜索引擎带来的流量在短时间内异常数据异常。所以,站长可以利用百度搜索资源平台(原百度站长平台)的索引量工具,观察站点索引量是否有异常;如果发现数据异常,再通过流量与关键词工具查看获得流量的关键词是否与网站有关、是否涉及博彩和色情;

√ 通过Site语法查询站点,结合一些常见的色情、博彩类关键词效果更佳,有可能发现不属于站点的非法页面;

√ 由于百度流量巨大,有些被黑行为仅针对百度带来的流量予以跳转,站长很难发现,所以在查看自己站点是否被黑时,一定要从百度搜索结果中点击站点页面,查看是否跳转到了其他站点;

√ 站点内容在百度搜索结果中被提示存在风险;

√ 后续可以请网站技术人员通过后台数据和程序进一步确认网站是否被黑。

其次,被黑之后如何处理

√ 确认网站被黑后,SEO人员除了要推动技术人员快速修正外,还需要做一些善后和预防的工作;

√ 网站如有变更页面,变更页面建议使用链接提交工具向百度提交数据;

√ 立即停止网站服务,避免用户继续受影响,防止继续影响其他站点;

√ 如果同一主机提供商同期内有多个站点被黑,可以联系主机提供商,敦促对方做出应对;

√ 清理已发现的被黑内容,将被黑页面设置为404死链,并通过百度搜索资源平台(原百度站长平台)死链提交工具进行提交。(我们发现有些站点采用了将被黑页面跳转至首页的做法,非常不可取。);

√ 排查出可能的被黑时间,和服务器上的文件修改时间相比对,处理掉黑客上传、修改过的文件;检查服务器中的用户管理设置,确认是否存在异常的变化;更改服务器的用户访问密码。注:可以从访问日志中,确定可能的被黑时间。不过黑客可能也修改服务器的访问日志;

√ 做好安全工作,排查网站存在的漏洞,防止再次被黑。

网站自我防护的注意事项:

√ 多种安全防护同步进行:适合中小型资讯网站;

● 网站程序勤打补丁:现在很多资讯类网站用的系统使用了内容管理系统(CMS),作为新闻发布系统,功能还算可以了,但是作为比较常见的内容管理系统(CMS),也有另一个问题,那就是漏洞比较大众化,因为源码是公开的,所以很容易被研究出漏洞,需要对网站程序及时进行漏洞修复。

√ 对服务器进行常规的安全防护;

● 在上班时间之外,对服务器上的网站权限做设置,禁止文件修改,后台文件隐藏或迁移到根目录之外。

● 参考一些网站的安全设置,非限定的IP不能写入到数据库。

√ 不使用开源程序默认的robots文件;

● 下图是一个地级市的资讯类站点的robots文件,从robots文件中可以看出,该网站用的是织梦后台,那黑客就可以通过各种针对织梦攻击的软件进行操作了,也可以针对织梦网站的常见漏洞进行扫描和针对性攻击了。

2.4.4 网络服务

2.4.4.1 CDN

从搜索抓取机制上讲:百度蜘蛛对站点的抓取方式和普通用户访问一样,只要普通用户能访问到的内容,百度蜘蛛就能抓取到。不管是用什么技术,只要能保证用户能流畅的访问网站,对搜索引擎就没有影响。但有站长反馈使用CDN后出现网站抓取异常、甚至流量异常等问题,主要是两方面的因素:

一是部分CDN服务商硬件投入不够,经常出现不稳定情况,会导致大量的蜘蛛抓取失败,从而影响网站抓取效果,有的甚至影响了索引量数据;所以选择有实力的CDN服务商很重要;

二是缓存机制在网站出现死链、无法打开、被黑等情况的时候起到了推波助澜的作用。短时间内产生了一些不利快照,影响了排名。这种情况不用担心,及时清理源文件和CDN缓存,并在百度搜索资源平台(原百度站长平台)提交相关死链数据等方法进行挽回,是可以恢复的。

3 网站优化

3.1 抓取友好性

关于抓取的优先级,在此重点强调:

√ 网站更新频率:经常更新高价值的站点,优先抓取;

√ 受欢迎程度:用户体验好的站点,优先抓取;

√ 优质入口:优质站点内链接,优先抓取;

√ 历史的抓取效果越好,越优先抓取;

√ 服务器稳定,优先抓取;

√ 安全记录优质的网站,优先抓取;

顺畅稳定的抓取是网站获得搜索用户、搜索流量的重要前提,影响抓取的关键因素,站长可以通过本章节了解。

3.1.1 URL规范

网站的URL如何设置,可参考2.3.1中的URL设置规范

3.1.1.1 参数

URL中的参数放置,需遵循两个要点:

√ 参数不能太复杂;

√ 不要用无效参数,无效参数会导致页面识别问题,页面内容最终无法在搜索展示

另外,很多站长利用参数(对搜索引擎和页面内容而言参数无效)统计站点访问行为,这里强调下,尽量不要出现这种形式资源,例如:

https://www.test.com/deal/w00tb7cyv.html?s=a67b0e875ae58a14e3fcc460422032d3

或者:

http://nmtp.test.com/;NTESnmtpSI=029FF574C4739E1D0A45C9C90D656226.hzayq-nmt07.server.163.org-8010#/app/others/details?editId=&articleId=578543&articleType=0&from=sight

3.1.2 链接发现

3.1.2.1 百度蜘蛛

很多站长会咨询如何判断百度移动蜘蛛,这里推荐一种方法,只需两步,正确识别百度蜘蛛:

查看UA

如果UA都不对,可以直接判断非百度搜索的蜘蛛,目前对外公布过的UA是:

移动UA 1:

Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,likeGecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+2019/20190426A/F0120742 search/ spider.html)

移动UA 2:

Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 likeMac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143Safari/601.1 (compatible; Baiduspider-render/2.0; +2019/20190426A/F0120742search/spider.html)

PC UA 1:

Mozilla/5.0 (compatible; Baiduspider/2.0;+2019/20190426A/F0120742search/spider.html)

PC UA 2:

Mozilla/5.0(compatible;Baiduspider-render/2.0;+2019/20190426A/F0120742search/ spider.html)

反查IP

站长可以通过DNS反查IP的方式判断某只蜘蛛是否来自百度搜索引擎。根据平台不同验证方法不同,如Linux/Windows/OS三种平台下的验证方法分别如下:

在Linux平台下,可以使用hostip命令反解IP来判断是否来自百度蜘蛛的抓取。百度蜘蛛的hostname以*.baidu.com格式命名,非*.baidu.com即为冒充。

这里需要再提出一点,建议使用DNS更换为8.8.8.8后进行nslookup反向解析,否则很容易出现无返回或返回错误的问题。

在Windows平台下,可以使用nslookup ip命令反解IP来判断是否来自百度蜘蛛的抓取。打开命令处理器输入nslookup xxx.xxx.xxx.xxx(IP地址)就能解析IP,来判断是否来自百度蜘蛛的抓取,百度蜘蛛的hostname以*.baidu.com格式命名,非*.baidu.com即为冒充。

在Mac OS平台下,网站可以使用dig命令反解IP来判断是否来自百度蜘蛛的抓取。打开命令处理器输入dig xxx.xxx.xxx.xxx(IP地址)就能解析IP,来判断是否来自百度蜘蛛的抓取,百度蜘蛛的hostname以*.baidu.com的格式命名,非*.baidu.com即为冒充。

3.1.2.2 链接提交

链接提交工具是网站主动向百度搜索推送数据的工具,网站使用链接提交可缩短爬虫发现网站链接时间,目前链接提交工具支持四种方式提交:

√ 主动推送:是最为快速的提交方式,建议将站点当天新产出链接立即通过此方式推送给百度,以保证新链接可以及时被百度抓取;

√ Sitemap:网站可定期将网站链接放到Sitemap中,然后将Sitemap提交给百度。百度会周期性的抓取检查提交的Sitemap,对其中的链接进行处理,但抓取速度慢于主动推送;

√ 手工提交:如果不想通过程序提交,那么可以采用此种方式,手动将链接提交给百度;

√ 自动推送:是轻量级链接提交组件,将自动推送的JS代码放置在站点每一个页面源代码中,当页面被访问时,页面链接会自动推送给百度,有利于新页面更快被百度发现。

简单来说:建议有新闻属性站点,使用主动推送进行数据提交;新验证平台站点,或内容无时效性要求站点,可以使用Sitemap将网站全部内容使用Sitemap提交;技术能力弱,或网站内容较少的站点,可使用手工提交方式进行数据提交;最后,还可以使用插件方式,自动推送方式给百度提交数据。

3.1.3 网页抓取

3.1.3.1 访问速度

关于移动页面的访问速度,百度搜索资源平台(原百度站长平台)已于2017年10月推出过闪电算法,针对页面首页的打开速度给予策略支持。闪电算法中指出,移动搜索页面首屏加载时间将影响搜索排名。移动网页首屏加载时间在2秒之内的,在移动搜索下将获得提升页面评价优待,获得流量倾斜;同时,在移动搜索页面首屏加载非常慢(3秒及以上)的网页将会被打压。

对于页面访问速度的提速,这里也给到几点建议:

资源加载:

√ 将同类型资源在服务器端压缩合并,减少网络请求次数和资源体积;

√ 引用通用资源,充分利用浏览器缓存;

√ 使用CDN加速,将用户的请求定向到最合适的缓存服务器上;

√ 非首屏图片类加载,将网络带宽留给首屏请求。

页面渲染:

√ 将CSS样式写在头部样式表中,减少由CSS文件网络请求造成的渲染阻塞;

√ 将Java放到文档末尾,或使用异步方式加载,避免JS执行阻塞渲染;

√ 对非文字元素(如图片,视频)指定宽高,避免浏览器重排重绘;

希望广大站长持续关注页面加载速度体验,视网站自身情况,参照建议自行优化页面,或使用通用的加速解决方案(如MIP),不断优化页面首屏加载时间。

了解MIP-移动网页加速器可参考:2019/20190426A/F0120748.html

3.1.3.2 返回码

HTTP状态码是用以表示网页服务器HTTP响应状态的3位数字代码。各位站长在平时维护网站过程中,可能会在站长工具后台抓取异常里面或者服务器日志里看到各种各样的响应状态码,有些甚至会影响网站的SEO效果,例如重点强调网页404设置,百度搜索资源平台(原百度站长平台)中部分工具如死链提交,需要网站把内容死链后进行提交,这里要求设置必须是404。

下面为大家整理了一些常见的HTTP状态码:

301:(永久移动)请求的网页已被永久移动到新位置。服务器返回此响应(作为对GET或HEAD请求的响应)时,会自动将请求者转到新位置。

302:(临时移动)服务器目前正从不同位置的网页响应请求,但请求者应继续使用原有位置来进行以后的请求。此代码与响应GET和HEAD请求的301代码类似,会自动将请求者转到不同的位置。

这里强调301与302的区别:

301/302的关键区别在于:这个资源是否存在/有效;

301指资源还在,只是换了一个位置,返回的是新位置的内容;

302指资源暂时失效,返回的是一个临时的代替页(例如镜像资源、首页、404页面)上。注意如果永久失效应当使用404。

有时站长认为百度对302不友好,可能是误用了302处理仍然有效的资源;

400:(错误请求)服务器不理解请求的语法;

403:(已禁止)服务器已经理解请求,但是拒绝执行它;

404:(未找到)服务器找不到请求的网页;

这里不得不提的一点,很多站长想自定义404页面,需要做到确保蜘蛛访问时返回状态码为404,若因为404页面跳转时设置不当,返回了200状态码,则容易被搜索引擎认为网站上出现了大量重复页面,从而对网站评价造成影响;

500:(服务器内部错误)服务器遇到错误,无法完成请求;

502:(错误网关)服务器作为网关或代理,从上游服务器收到了无效的响应;

503:(服务不可用)目前无法使用服务器(由于超载或进行停机维护)。通常,这只是一种暂时的状态;

504:(网关超时)服务器作为网关或代理,未及时从上游服务器接收请求。

3.1.3.3 robots

robots工具的详细工具使用说明,细节参考4.3.4robots工具章节,关于robots的使用,仅强调以下两点:

√ 百度蜘蛛目前在robots里是不支持中文的,故网站robots文件编写不建议使用中文字符;

√ robots文件支持UrlEncode编码这种写法,如:http://www.test.cn/%E7%89%B9%E6%AE%8A:%E6%B5%8F%E8%A7%88/%E7%94%9F%E6%AD%BB%E7%8B%99%E5%87%BB:%E7%99%BD%E9%93%B6%E5%8A%A0%E7%89%B9%E6%9E%97

3.1.3.4 死链

当网站死链数据累积过多,并且被展示到搜索结果页中,对网站本身的访问体验和用户转化都起到了负面影响。另一方面,百度检查死链的流程也会为网站带来额外负担,影响网站其他正常页面的抓取和索引。

百度搜索资源平台(原百度站长平台)推出死链提交工具,帮助网站提交死链数据,死链提交工具使用参考4.3.2死链提交工具。

什么是死链及死链的标准

页面已经无效,无法对用户提供任何有价值信息的页面就是死链接,比较常见死链形式共有3种,协议死链和内容死链是比较常见两种形式,除此之外还有跳转死链。

√ 协议死链:页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等;

√ 内容死链:服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面;

√ 跳转死链:指页面内容已经失效,跳转到报错页,首页等行为。

3.1.4 访问稳定性

访问稳定性主要有以下几个注意点:

DNS解析

DNS是域名解析服务器,关于DNS,这里建议中文网站尽可能使用国内大型服务商提供的DNS服务,以保证站点的稳定解析。

分享一个DNS稳定性的示例:

搜索资源平台(原站长平台)曾收到多个站长反馈,称网站从百度网页搜索消失,site发现网站数据为0。

经追查发现这些网站都使用国外某品牌的DNS服务器 *.DOMAINCONTROL.COM,此系列DNS服务器存在稳定性问题,百度蜘蛛经常解析不到IP,在百度蜘蛛看来,网站是死站点。此前也发现过多起小DNS服务商屏蔽百度蜘蛛解析请求或者国外DNS服务器不稳定的案例。因此这里建议网站,谨慎选择DNS服务。

蜘蛛封禁

针对爬虫的封禁会导致爬虫认为网站不可正常访问,进而采取对应的措施。爬虫封禁其实分两种,一种就是传统的robots封禁,另一种是需要技术人员配合的IP封禁和UA封禁;而绝大多数情况下的封禁都是一些操作不当导致的误封禁,然后在搜索引擎上的反应就是爬虫不能正常访问。所以针对爬虫封禁的操作一定要慎重,即使因为访问压力问题要临时封禁,也要尽快做恢复处理。

服务器负载

抛开服务器硬件问题(不可避免),绝大多数引起服务器负载过高的情况是软件程序引起的,如程序有内存泄露,程序出core,不合理混布服务(其中一个服务消耗服务器资源过大引起服务器负载增大,影响了服务器对爬虫访问请求的响应。)对于提供服务的机器一定要注意服务器的负载,留足够的buffer保证服务器具有一定的抗压能力。

其他人为因素

人为操作不当引起访问异常的情况是经常见到的,针对这种情况需要严格的制度约束,不同站点情况不一样。需要保证每一次的升级或者操作要准确无误。

3.1.5 可访问链接总量

3.1.5.1 资源可穷尽

一般来说网站的内容页面是可穷尽的,万级别,百万级别甚至亿级别,但一定是可穷尽的。而现实中确实存在这样一些网站,爬虫针对这些网站进行抓取提链时会陷入”链接黑洞”;通俗的讲就是网站给爬虫呈现的链接不可穷尽;典型的是部分网站的搜索结果页,不同的query在不同anchor下的a标签链接不一样就导致了”链接黑洞”的产生,所以严禁URL的生成跟用户的访问行为或者搜索词等因素绑定。

3.2 页面解析

页面解析,主要指网站页面被蜘蛛抓取,会对页面进行分析识别,称之为页面解析。页面解析对网站至关重要,网站内容被抓取是网站被发现的第一步,而页面解析,则是网站内容被识别出来的重要一环,页面解析效果直接影响搜索引擎对网站的评价。

3.2.1 页面元素

3.2.1.1 页面标题

关于网页标题,百度搜索于2017年9月推出清风算法,重点打击网站标题作弊,引导用户点击,损害用户体验的行为;清风算法重点打击的标题作弊情况有以下两种:

√ 文不对题,网站标题与正文有明显不符合,误导搜索用户点击,对搜索用户造成伤害;

√ 大量堆砌,网站标题中出现大量堆砌关键词的情况也十分不提倡,

关于网站标题作弊的详细解读,参考搜索学院发布官方文档《百度搜索内容质量白皮书——网页标题作弊详解》。

关于网站TDK,有以下几种情况需要注意:(”T”代表页头中的title元素,”D”代表页头中的deion元素,”K”代表页头中的keywords元素,简单指网站的标题、描述和摘要);

√ 百度未承诺严格按照title和deion的内容展示标题和摘要,尤其是摘要,会根据用户检索的关键词,自动匹配展示合适的摘要内容,让用户了解网页的主要内容,影响用户的行为决策;

√ 站长会发现同一条链接的摘要在不同关键词下是变化的,可能不会完全符合站长预期,尤其是站长在检索框进行site语法操作时,可能会感觉摘要都比较差。但请不要担心,毕竟绝大多数普通网民不会这样操作。在此情况下出现不符合预期的摘要并不代表站点被惩罚;

√ 还有一种情况,是网页中的HTML代码有误,导致百度无法解析出摘要,所以有时大家会看到某些结果的摘要是乱码(当然这种情况很少见),所以也请站长注意代码规范。

3.2.1.2 主体内容

主体内容注意两个点,一个主体内容过长(通常网页源码长度不能超过128k),文章过长可能会引起抓取截断;另外一个是注意内容不能空短,空短内容也会被判断为无价值内容。

以下分析两个示例:

关于主体内容过长的示例分析:

某网站主体内容都是JS生成,针对用户访问,没有做优化;但是网站特针对爬虫抓取做了优化,直接将图片进行编码推送给百度,然而优化后发现内容没有被百度展示出来;

页面质量很好,还特意针对爬虫做了优化,为什么内容反而无法出现在百度搜索中;

分析主要有以下原因:

√ 网站针对爬虫爬取做的优化,是直接将图片编码后放到HTML中,导致页面长度过长,网站页面长度达164k;

√ 站点优化后将主体内容放于最后,图片却放于前面;

√ 爬虫抓取内容后,页面内容过长被截断,已抓取部分无法识别到主体内容,最终导致页面被认定为空短而不建索引。

这样的情况给到以下建议:

√ 如站点针对爬虫爬取做优化,建议网站源码长度在128k之内,不要过长;

√ 针对爬虫爬取做优化,请将主体内容放于前方,避免抓取截断造成的内容抓取不全。

关于内容空短的示例分析:

某网站反馈网站内容未被建索引,分析发现,网站抓取没有问题,但被抓取到的页面,都提示需要输入验证码才能查看全部页面,这类页面被判断为空短页面,这类页面在抓取后,会被判定为垃圾内容。

而且当蜘蛛对一个网站抓取后发现大面积都是低值的空短页面时,爬虫会认为这个站点的整体价值比较低,那么在后面的抓取流量分布上会降低,导致针对该站点的页面更新会比较慢,进而抓取甚至建索引库也会比较慢。

为什么会出现网站内容空短这种情况,其中一个原因是网站内容未全部搭建完成,未对外开放,但已被蜘蛛爬取发现。针对这种情况,建议网站在邀请测试阶段使用robots封禁。

另外还会有些网站,设置用户查看权限,如需用户登陆才能查看全部内容,这样的行为对搜索引擎也极不友好,蜘蛛无法模拟用户登陆,仅能抓取网站已展示页面,可能会导致抓取页面为空短的现象。

这里再次强调,不要让爬虫给站点画上不优质的标签,对网站将产生很不好的影响。另外,移动端的H5页面,很多都是采用JS方式加载,其实是更容易产生空短,请各位站长注意。

3.2.1.3 网页发布时间

关于网页发布时间,有以下几点建议:

√ 网页内容尽可能加上产出时间,严格说是内容发布时间;且时间尽量全,时间格式为年-月-日 时:分:秒;

例:2017-08-12 10:23:06

√ 网页上切忌乱加时间,这样容易造成页面时间提取问题,或搜索引擎判断提取时间不可信,从而降低对网页的展现。

3.2.1.4 canonical标签

canonical标签的目的

在PC互联网时代,canonical标签的作用主要是用来解决由于网址形式不同内容相同而造成的内容重复问题。而在移动时代,canonical标签被百度搜索赋予了更多的意义,在原来的作用基础上,又起到了相同内容的移动页和PC页之间的关联作用;让移动资源更容易继承PC资源的各种特征,从而快速生效移动网页数据。

canonical标签如何设置

在HTML代码的head里添加rel=”canonical”,不能添加多个,否则搜索引擎会认为是无效的canonical标签。另外需要注意href里的地址不能是死链,错误页或者被robots封禁的页面。

具体示例如下:

<link rel=”canonical” href=”http://example.test.com/recipe41644.html”>

3.2.2 落地页体验

为提升移动搜索整体用户体验,提升搜索满意度,百度搜索在2017年推出《百度移动搜索落地页体验白皮书——广告篇2.0》(以下简称广告白皮书)。广告白皮书对网站移动落地页页面广告内容、广告位置、大小等做了明确要求,从而充分保证搜索用户的浏览体验。

白皮书详情,请参考搜索学院官方文档《百度移动搜索落地页体验白皮书——广告篇2.0》

3.3 页面价值

3.3.1 内容价值

原创文章,要求是独立完成的创作,且没有歪曲、篡改他人创作或者抄袭、剽窃他人创作而产生的作品,对于改编、注释、整理他人已有创作而产生的作品要求有充分的点评、补充等增益信息。

建议原创文章在标题下方明确注明“来源:xxxx(本站站点名)”或“本站原创”之类字样,转载文章明确注明“来源:xxxx(转载来源站点名)”之类字样,不建议使用“admin”、“webmaster”、“佚名”等模糊的说法。

3.3.2 外链建设

通常认为,外链是本站点对第三方站点页面的链接指向,是本站点对第三方站点页面内容的一种认可和推荐。

站点进行外链建设时,建议是有真实推荐意图,并且指向那些熟悉的、被认可的、内容相关的外部页面;不建议推荐与本站点页面内容无关的外链内容。也不建议乱推荐外链、交换外链互联、指向作弊站的行为(这些很可能被超链策略反向识别成垃圾作弊站点进行打压)。

最后,站长要及时发现和处理站点被黑的页面。页面被黑掉后,一般会被人为放入大量无关的,甚至作弊的外链在该页面上,其目的是要瓜分站点自身权重,并以此来提高外链目标站点影响力。建议站长发现后,及时向搜索资源平台(原站长平台)提交死链进行删除和屏蔽,不及时处理一定程度上会影响站点本身的权重。最好从技术上优化,提高站点安全壁垒,防范于未然。

3.3.3 内链建设

内链,描述了站点的结构,一般起到页面内容组织和站内引导的作用;内链的重要意思是通过链接指向,告诉搜索引擎哪个页面最为重要。

内链组织的时候,建议结构清晰,不要过于冗杂,另外内链组织的版式建议保持一致,这样对搜索引擎超链分析比较友好。

与外链类似,建议站长善于使用nofollow标签,既对搜索引擎友好,又可避免因垃圾link影响到站点本身的权重。

3.3.4 anchor

anchor描述:尽可能使用典型的,有真实意义的anchor。anchor描述要与超链接的页面内容大致相符,避免高频无意义anchor的使用,另外同一个URL的anchor描述种类不宜过多,anchor分布越稀疏会影响搜索排名。

4 百度专属SEO工具

4.1 百度搜索资源平台(原百度站长平台)介绍

百度搜索资源平台(原百度站长平台)是全球最大的面向中文互联网管理者、移动开发者、创业者的搜索流量管理的官方平台。提供有助于搜索引擎数据查询及优化的工具、SEO建议、多端适配服务的能力等。

百度搜索资源平台域名地址:http://ziyuan.baidu.com/

4.2 查询工具

4.2.1 索引量工具

网站的索引量指该网站在百度搜索上,可以被用户搜索到的链接总量。百度蜘蛛通过抓取发现网站内容,进行页面解析,对有价值内容建立索引库,最终使搜索用户可以搜索到网站内容。

网站被百度蜘蛛抓取后,经过一系列计算才得以建入索引库,有了和搜索用户见面的机会。所以,索引量一直是站长们关注的焦点,但关于索引量工具有一些误读,这里给到正确解答:

√ 索引量不等于网站流量:索引库分多个层级,进入上层索引库才有更多与搜索用户见面的机会;进入下层库机会渺茫。所以,索引量总体的增加减少并不能说明流量会有什么变化;

√ 索引量变化不直接影响流量变化:当流量发生巨大变化时,索引量数据可以作为排查原因的渠道之一,但不是唯一排查渠道,索引量变化并不直接影响流量变化;

√ 索引量浮动情况,索引量上下浮动10%(经验值),甚至更多,都可能属于正常。只要流量变化不大就不用紧张。

4.2.2 流量与关键词工具

流量与关键词工具提供站点的热门关键词在百度搜索结果中的展现及点击量数据,通过对关键词表现情况的监控,帮助网站更好进行优化,流量与关键词工具可全面帮助站长了解网站在百度搜索引擎中的表现,决定页面及网站的优化方向,为网站运营决策提供分析依据。

关于流量与关键词工具,还有一点需要强调,如果站长需要在反馈中心中提交关于网站流量异常的情况,请使用此工具的数据、及数据截图作为证据,便于工作人员分析网站问题。

4.2.3 抓取频次工具

什么是抓取频次

抓取频次是搜索引擎在单位时间内(天级)对网站服务器抓取的总次数,如果搜索引擎对站点的抓取频次过高,很有可能造成服务器不稳定,百度蜘蛛会根据网站内容更新频率和服务器压力等因素自动调整抓取频次。

什么情况下可以进行抓取频次上限调整:

首先,百度蜘蛛会根据网站服务器压力自动进行抓取频次调整;

其次,如果百度蜘蛛的抓取影响了网站稳定性,站长可以通过此工具调节百度蜘蛛每天抓取网站的频次上限。

强调1:调整抓取频次上限不等于调高抓取频次;

强调2:建议站长慎重调节抓取频次上限值,如果抓取频次过小则会影响百度蜘蛛对网站的及时抓取,从而影响索引。

4.2.4 抓取诊断工具

什么是抓取诊断

抓取诊断工具,可以让站长从百度蜘蛛的视角查看抓取内容,自助诊断百度蜘蛛看到的内容,和预期是否一致。每个站点每周可使用200次,抓取结果只展现百度蜘蛛可见的前200KB内容。

抓取诊断工具能做什么

目前抓取诊断工具有如下作用:

√ 诊断抓取内容是否符合预期,譬如很多商品详情页面,价格信息是通过Java输出的,对百度蜘蛛不友好,价格信息较难在搜索中应用。问题修正后,可用诊断工具再次抓取检验;

√ 诊断网页是否被加了黒链、隐藏文本。网站如果被黑,可能被加上隐藏的链接,这些链可能只在百度抓取时才出现,需要用此抓取工具诊断。

4.2.5 抓取异常工具

什么是抓取异常

百度蜘蛛无法正常抓取,就是抓取异常。通常网站出现抓取异常,都是网站自身原因造成,需要网站根据工具提示,尽快自查网站问题并解决。

抓取异常对网站有哪些影响

对于大量内容无法正常抓取的网站,搜索引擎会认为网站存在用户体验上的缺陷,并降低对网站的评价,在抓取、索引、搜索评价上都会受到一定程度的负面影响,最终影响到网站从百度获取的流量。

抓取异常的原因有哪些

● 网站异常

√ DNS异常:当百度蜘蛛无法解析网站的IP时,会出现DNS异常。可能是网站IP地址错误,或者域名服务商把百度蜘蛛封禁。请使用whois或者host查询自己网站IP地址是否正确且可解析,如果不正确或无法解析,请与域名注册商联系,更新网站IP地址;

√ 连接超时:抓取请求连接超时,可能原因服务器过载,网络不稳定;

√ 抓取超时:抓取请求连接建立后,下载页面速度过慢,导致超时,可能原因服务器过载,带宽不足;

√ 连接错误:无法连接或者连接建立后对方服务器拒绝。

● 链接异常

√ 访问被拒绝:爬虫发起抓取,httpcode返回码是403;

√ 找不到页面:爬虫发起抓取,httpcode返回码是404;

√ 服务器错误:爬虫发起抓取,httpcode返回码是5XX;

√ 其他错误:爬虫发起抓取,httpcode返回码是4XX,不包括403和404。

4.3 提交工具

4.3.1 链接提交工具

目前一共有4种提交方式,分别是主动推送、Sitemap、手工提交和自动推送,这四种推送方式的区别,请看下图:

建议有新闻属性站点,使用主动推送进行数据提交;新验证平台站点,或内容无时效性要求站点,可以使用Sitemap将网站全部内容使用Sitemap提交;技术能力弱,或网站内容较少的站点,可使用手工提交方式进行数据提交;最后,还可以使用插件方式,自动推送方式给百度提交数据。

使用链接提交工具,还需要注意的是,部分网站会采用第三方插件推送数据,插件推送方式需要站长仔细检查推送逻辑,之前发生过站长使用第三方插件推送数据,而第三方插件采用域名+标题进行推送,这样导致推送给百度的URL中存在中文字符,带有中文字符的URL会301跳转到真实的URL上,出现此类情况,是无法享受快速抓取优待的。

链接提交工具可以快速帮助站点实现内容抓取,使用第三方插件可以快速帮助站长解决推送的问题,站长只需在选择插件时,仔细检查下插件数据逻辑,否则推送错误数据,网站数据无法享受快速抓取优待。

4.3.2 死链提交工具

为什么要使用死链工具

当网站死链数据累积过多时,并且被展示到搜索结果页中,对网站本身的访问体验和用户转化都起到了负面影响。另一方面,百度检查死链的流程也会为网站带来额外负担,影响网站其他正常页面的抓取和索引。

注意事项:

√ 请推送协议死链数据,死链工具仅支持协议死链数据;

√ 提交死链被删除后,网站可以删除已提交的死链文件,否则搜索仍会继续抓取死链文件,确认文件中内容。

什么是死链规则提交?

死链规则是链接前缀,且匹配前缀的链接全部是死链。

目前支持两种死链规则:

√ 目录规则:以“/”结尾的前缀;

√ CGI规则:以“?”结尾的前缀。

什么是死链文件提交?

√ 站长需要提交已被百度建索引的、且需要删除的链接,如链接在百度搜索不到,则可以不提交死链;

√ 需要删除的链接需要全部设置为404,如发现有链接非死链,会导致文件校验失败,从而无法删除死链;

√ 如死链文件抓取失败,可以通过抓取诊断工具判断死链文件是否可以正常抓取;