Feed on
Posts
Comments

国庆第六天,睁开惺忪的双眼打开电视,很诧异地看到CCTV中播报关于乔布斯去世的消息。震惊!

我承认,我是一个伪果粉。这辈子用过的苹果产品有3个。最早的是刚上大学时哥哥送的生日礼物——ipod一代。价格昂贵却品质精良的苹果产品让人珍爱无比。第二个便是今年年初时买的iPhone 4,但是悲剧的是前不久前丢掉了,痛心无比。第三个就是现在在使用的Macbook Pro,也刚刚脱离Windows,正在逼迫自己适应Mac OS的生态。我不是一个真正的苹果粉丝,但是我同样喜欢苹果,崇拜乔布斯!

启用Linode,靠谱的VPS

随着网上议论纷纷Linode新增日本机房,博主手发痒,马上录入了信用卡信息,启用了停了将近半年的Linode。

果然速度够给力!果然VPS的魅力还是这么十足!

Ping了下ip,大概在100ms左右,实地测试访问速度也非常理想。选择wdlinux套件来配置环境,非常顺畅。大家访问本博顺畅不?请麻烦测试并回复告知。

如果你正在考虑购置一台VPS,要求稳定、无需备案、售后服务优质、后台成熟的VPS主机商,强烈推荐你使用Linode。512的套餐价格是20美金一个月,如果你不只是放置一个个人博客的话,还是非常值得的。

SSH账号、VPN账号、SVN服务器等等附加价值都可以在VPS上亲手获得。

此外,推荐注册地址为:Linode

……(这部分涉及产品细节,略)

这样看来,我用一句话来概括:数据输入的多样化,数据组织的多样化以及数据本身的多样化。门户是属于Web1.0范畴的东西,但又不是真正的Web1.0,因为门户的数据不是网站(站长)提供的,只能算是一个伪Web1.0。所以 说看似CMS的门户本质上就是一个套着模板,拥有独立页面且能自定义的增强版热榜。而个人中心、群组等说白了就是SNS,也就是目前的圈子,DZ的 UCHOME。

另外,再回过头来讨论BBS这个东西。BBS是PW的核心,这个是毋庸置疑的。而PW随着潮流逐步进化也是不可避免的。

我之前写过的一篇文中讲到BBS和SNS的比较:

仔细看看常规SNS的架构,分析下它的各个模块(元素)和BBS的元素。其实 SNS只是BBS的一种进化,一些模块的巧妙改变所带来的显著提升罢了。

  1. SNS最主要的改变既是个人主页的出现。其实它只是将BBS的控制面板(个人信息)元素突显化而已。但这个小小的改变就使所有用户都成了“版主”。
  2. SNS还有其他形式各异的元素,比如状态、日志、照片、投票、分享、活动等。其实它们也只是BBS中主题帖前所加的分类的突显化。
  3. 我认为SNS最为有用的革命性更新就是信息的订阅机制。你所关注的信息或是传递给你的信息都会以最显著的形式进行提示。

BBS 到SNS的进化,就好像是从温饱到小康的改变。BBS的框架内,信息一股脑儿地放在一处,获取者只能手动筛选过滤;而在SNS这里,信息经过机器的过滤器 输出到不同管道(当然,这个过滤器设置在传输信息的前端),并且根据条件输出给目标对象。BBS到SNS的进化其实也是过滤机制的模型建立。而这个模型还 太过粗糙,有待改进。SNS继续革新(进化)的方向应该也是这个过滤器的进化。

另外补充两点,其一,BBS版块可以看作是群 组。两者的最大的不同是,BBS的版块相对固定且用户无法创建更改,而群组则相对自由;版块的用户即是全站用户,而群组的用户则相对独立。一个非常新鲜的例子就是VeryCD 社区,它以小组分类组织帖子。但这些小组又有版块的影子,即热门小组承担着版块的责任。

其二,BBS是一个适合做“小”的模式, 而SNS则相反。BBS在用户数量上是有天花板的,因为用户的注意力有限,站点的页面资源也是有限的。那些所谓超级“大”的BBS只能不停地开出数目众多 的新版块来缓解资源。而小的SNS同样是不合适的。SNS需要用户花一定的精力去充实你的个人页面(个人中心)。当众多的SNS充斥互联网时,最头疼的莫 过于用户(虽然有openID之类的解决方案,但数据为王的观念深入人心,谁都不想放手)。所以说UCHOME即便火爆,也是暂时的,它的定位就不是很准 确。

这样看下来,BBS应该也算是最早期的“SNS产品”。BBS中最为重要的数据就是帖子,也就是说人是围绕着帖子这个核心来进行交流 的。而像Facebook等的SNS,就是以人为核心。那么,今天所阐述的2010年的PW所站的位置在哪里呢?可以看出来,PW的设想是没有逃出 SNS,或者BBS的范畴(当然也没有必要搞另类的创新;我想,DZ传说中的X系统在也不可能有所超越),恰恰站在了它们中间。选择弱化BBS,将原先高 高在上的BBS(帖子)降低到与日志、相册等同样的层次。当然,这一步将会很漫长。站长们不会这么快地习惯这样的设计,更不用说广大的用户了。所以,弱化 BBS的同时不阻断后路。那些仍旧以BBS理念经营社区的站点在某个发展阶段内依旧可以坚持自己的方向。

最后,有些不幸地推断,PW、 DZ面向的主要客户如果仍旧是草根站长的话,就目前所出现的大大小小的模式来讲,只有BBS了。草根站长们无法经营好CMS站点,因为无法提供优质的内 容;无法经营好综合性的网店,因为无法做大;无法经营好理想的SNS站点,也是同样的道理。草根站长是否会成为历史名词我不敢讲,但可以肯定的是不会自己 开发的草根站长最终会被淘汰。我希望这个推断是荒谬的,或者这个日子还远远没有到来。

另外,我再天马行空地猜测下:假如PW、DZ等进化得理想,并且SNS思想普及得比较顺利的话。BBS还会在这些地方坚挺:某公司或产品的讨论区(与CMS结合)、主题型社区(会有很大的衰减但不会灭绝, 主要还是看是否有足够垄断的SNS站点)、资源站…目前活得比较滋润的地方站点将逐步进化到SNS形式,比如19楼、篱笆网等。二线城市不太可能会有 自己独立的SNS,理想状态是像19楼这样在大城市站稳脚跟的SNS站点继续扩大规模,占领一片区域,而不是一座城市。

Google、 Facebook、Twitter、Digg、Cragilist将互联网带入了Web2.0的时代,PW要做的不是纯粹地去独创什么模式,而是要将国外 先进的互联网模式理念与国内的用户习惯、市场形式融合,在一定程度上影响中国互联网的进步。

By orzcc  2010-1-27 0:11

 

SEO & 宠物

其实,做SEO和养宠物是一码事:

  1. 你需要每天喂养它新鲜的食物(原创内容)
  2. 你不能让它饱一顿饿一顿,必须每天精心的照料(持续更新)
  3. 你要经常带它出去溜溜,向你的朋友介绍你的爱宠(外链)
  4. 你的宠物只属于一个品种,所以你需要根据它的品种来对待它(切忌优化过度)
  5. 宠物需要慢慢成长,需要你每天的照料和驯养。经过必要的成长期,宠物才会长大才会温顺(SEO的禅)
呵呵,瞎说了一堆!别见怪!

Discuz X2推出了云平台,也正式开放了令人心动的QQ互联(QQ登录)。但是当你兴奋积极地开启了QQ互联功能时,你是否有意识到你正在一步步走向腾讯和康盛联合设下的陷阱呢?

直接开门见山:

  1. QQ互联与腾讯开放平台的QQ登录是有区别的
  2. QQ互联的注册环节没有密码设定
  3. 绝大部分通过QQ互联注册的用户是不会再去设定他的密码的
  4. 很大一部分绑定QQ账号的用户(设定了密码的),也可能已经忘记了它的密码
  5. 最关键的是作为站长的你,剥离QQ的情况下,无法来保证大部分用户都能正常登录
  6. 太恐怖了!
但是这个功能不用,也是怪可惜了。大部分用户是不清楚这些危害的,你公司的老板也可能不清楚。所以只需要稍微改下代码,稍微减弱些用户体验,你就能保证用户资料的独立性——在QQ互联注册环节强制要求用户设定密码。
操作:
1. 打开文件source/plugin/qqconnect/template/module.htm
(1) 查找

$('{$_G['setting']['reginput']['password']}').parentNode.parentNode.parentNode.parentNode.parentNode.style.display = 'none';
$('{$_G['setting']['reginput']['password']}').outerHTML += '$js1';
$('{$_G['setting']['reginput']['password']}').required = 0;
$('{$_G['setting']['reginput']['password2']}').parentNode.parentNode.parentNode.parentNode.parentNode.style.display = 'none';
$('{$_G['setting']['reginput']['password2']}').required = 0;

修改成

//$('{$_G['setting']['reginput']['password']}').parentNode.parentNode.parentNode.parentNode.parentNode.style.display = 'none';
$('{$_G['setting']['reginput']['username']}').outerHTML += '$js1';
$('{$_G['setting']['reginput']['password']}').required = 1;
//$('{$_G['setting']['reginput']['password2']}').parentNode.parentNode.parentNode.parentNode.parentNode.style.display = 'none';
$('{$_G['setting']['reginput']['password2']}').required = 1;

2 打开文件 source/module/member/member_connect.php
查找
$ctl_obj->setting['ignorepassword'] = 1;
将它注释掉,或者删除
3 打开文件 source/module/member/member_register.php
查找

DB::query("INSERT INTO ".DB::table('common_member_connect')." (uid, conuin, conuinsecret, conopenid, conispublishfeed, conispublisht, conisregister, conisqzoneavatar, conisfeed) VALUES ('$uid', '$conuin', '$conuinsecret', '$conopenid', '$conispublishfeed', '$conispublisht', '1', '$is_qzone_avatar', '$user_auth_fields')");

修改成

DB::query("INSERT INTO ".DB::table('common_member_connect')." (uid, conuin, conuinsecret, conopenid, conispublishfeed, conispublisht, conisregister, conisqzoneavatar, conisfeed) VALUES ('$uid', '$conuin', '$conuinsecret', '$conopenid', '$conispublishfeed', '$conispublisht', '0', '$is_qzone_avatar', '$user_auth_fields')");

演示站点见:宁波团购论坛

国外团购信息的抓取

因缘巧合,碰到一个加拿大人,硬是想做一个基于方维系统的yipit。但是国外团购站都没有什么统一的API,所以抓取团购信息成为了一个难题。在Quora、Stack Overflow上都搜了一遍,其他人基本都是靠硬采集的方式(还有RSS)来进行,没有一种便捷的方案。

仔细研究了一番,做了一个demo版的蜘蛛,只做了groupon.ca的抓取。

第一步首先抓取groupon的rss,获取最新团购信息的几个简单参数。

第二部就是通过rss中抓取的团购信息链接,去硬采集其他详细信息。

不直接进行第二步原因主要是因为rss的输出相对稳定,结构单一,所以其实第一步就是一个团购信息的索引。

蜘蛛演示:http://www.ohdealio.com/ (加拿大哥们的半成品站)

更改hosts的方法还是老样子,Windows用户请编辑:C:\Windows\System32\drivers\etc;Mac和Linux用户请编辑/etc/hosts

203.208.46.22 talkgadget.google.com

2404:6800:8005::71 profiles.google.com
2404:6800:8005::65 plusone.google.com
2404:6800:8005::8a plus.google.com
2404:6800:8005::62 talkgadget.google.com

203.208.46.180 lh6.googleusercontent.com
203.208.46.180 lh5.googleusercontent.com
203.208.46.180 lh3.googleusercontent.com
203.208.46.180 lh2.googleusercontent.com
203.208.46.180 lh1.googleusercontent.com
203.208.46.180 lh4.googleusercontent.com
203.208.46.180 webcache.googleusercontent.com
203.208.46.180 mail.google.com
203.208.46.180 www.google.com.hk
203.208.46.180 www.google.com
203.208.46.180 picasaweb.google.com
203.208.46.180 www.googlelabs.com
203.208.46.180 docs.google.com
203.208.46.180 plus.google.com
203.208.46.180 plus.google.com.hk
203.208.46.180 profiles.google.com
203.208.46.180 services.google.com
203.208.46.180 clients4.google.com
203.208.46.180 clients2.google.com
203.208.46.180 chrome.google.com
203.208.46.180 tools.google.com

此外,搜索hosts类容易过期的信息,最好的方法不是去google,而是去twitter、微博之类的即时平台,比较靠谱!

制作Sitemap

由于SEO优化需要,制作Google格式与百度格式的Sitemap各一份。重新开发一个脚本成本比较大,但是方维系统集成了Discuz程序,所以从Discuz入手。

从Discuz官方找了一个Sitemap的插件,插件地址为:http://www.discuz.net/thread-1896777-1-1.html

正好,这款插件提供了Google和百度两种规格的脚本,可以直接用定时钟生成。

优化工作:

  1. 优化导航栏部分的地址,剔除非伪静态的地址,手工加上团购的导航和Discuz的导航的伪静态地址
  2. 生成团购站地址,格式为:http://www.t0574.com/site/3.html
  3. 生成团购详细页地址,格式为:http://www.t0574.com/group/4977.html
  4. 帖子部分剔除隐藏版块的地址
  5. 将sitemap的生成路径改为根目录(也就是Discuz的上一层),记得同时改索引sitemap中的URL
我直接只上传了定时钟部分的脚本,应用起来足够了。然后在robots.txt里加入百度格式的sitemap的索引URL。同时在Google网站管理员工具中提交Google格式的Sitemap路径。

宁波团购大全采用方维团购导航程序,之前一直通过手动执行php脚本进行采集入库,然后手动更新商品缓存,每天执行1~2次。这样会造成两个问题,其一是手动执行非常耗费精力,其二就是无法做到最新商品信息的采集,以及团购商品购买数量上的状态更新。

于是,周末花了大半天时间实现了定时钟自动采集入库的方案。大体流程上没有什么问题,就是屏蔽了原先通过跳转页面进行采集的跳转过程和输出过程,全部统一为记录生成采集日志。服务器是CentOS,直接设置一个定时钟来定期运行下上面的脚本。

实现过程中碰到两个比较棘手的问题:首先,跑采集时发现500内部错误,具体原因是执行超时,环境上有相关限制。

1. 脚本上做了相应的延长

ini_set('max_execution_time', 600);
ini_set("memory_limit", "100M");

2. fpm的request_slowlog_timeout参数改大点

第二问题,其实也算是脚本执行时间过长。在采集日志中做了每个团购站api采集时间的记录,发现像QQ团购(没有分城市API区分)之类的API特别大,因为把全国所有城市的最新团购信息都提供在里面。采集程序需要远程打开这个大API,去遍历采集本站所需的团购信息。所以这个过程会耗时很长。

没有想到更好的办法前,只能将采集程序分成两个脚本,一个采集中小API的主采集脚本,另一个专门处理大API的辅采集脚本。主采集脚本设定定时钟为每3个小时运行一次,辅脚本设定为每天运行一次。

定时钟的设置也需要考虑下,因为大部分团购站会在凌晨00:00自动发布团购信息,所以主采集脚本定时在00:10为每天的第一次采集,辅采集脚本就定时在00:30进行采集。

一些常见的SEO问题,感谢Lestar的回答和整理!

1、什么是黑链?

答:所谓黑链是隐藏链接,用户看不到,但通过搜索引擎能识别出来的链接。

2、你能帮我查出我有多少条黑链及那些挂我黑链的网址吗?

答:当然能的,同时你自己也能通过yahoo.com 中输入 link:你的域名 一个一个翻查出来的。

3、在进行SEO合作关系确定后,我需要把我网站的FTP、后台等信息提供给你吗?

答、一般情况如果你有自己的程序员的话,是不需要给我提供这些信息,我直接给出需要调控的内容,然后你安排你的技术处理,如果客户没有技术人员负责这些内容调控的话,我这边也会免费帮忙调控的。

4、XX词做上去排名得多久?

答:理论上每2个月为一个周期,一般站点2月时间达到理想状态的,特殊站点,如被降权惩罚过、快照延迟一周之外等站点的问题,或关键词竞争度过强,时间可能会延迟。

5、关于SEO的外链方面能具体可以透露下什么操作吗?

答:目前大都是在博客、目录、网摘收录上的导向链接建设,这些你应该也知道的吧,但主要的是在操作过程当中的规律及量的分配。

6、我是做宁波团购的,我在添加友情链接时跟宁波地区与非宁波地区的团购站链接哪个质量好?

答:当然是多添加宁波当地的团购或购物类站点的质量好了,同时宁波当地的论坛及门户等站点的友情链接的质量也比较不错。非宁波地区的团购类站点友情链接的质量比宁波本地的非团购类站点的质量好些,毕竟类型是相同的。

7、在添加友情链接时需不需要他的PR值跟我的相等或比我的高,比我低的用链接吗?

答:添加友情链接时不用在意他的PR值有多高,只用查看他的导出链接数量、百度快照时间、现有关键词排名。

8、添加友情链接需要注意哪些及要点?

答:导出链接数量在30个以内、百度快照时间隔夜或二天内、及网站名称或关键词的排名位置。

9、假使某一天我要更改网站名称,SEO收录是不是会影响很大?那一般如何处理的?

答:如果非得修改的话,那只有修改好后,等待大概一周到一月的时间,如果站点权重不错的话,第二天即可更新。

10、听说新域名加过多外链会被百度卡擦掉?

答:新域名猛加过多外链自然对搜索引擎来说有些危险的了。

11、论坛域名选择bbs.t0574.com好还是www.t0574.com/bbs好,从给主站带来权重来讲。

答:这个以前也回答过,www.t0574.com/bbs 比较好,更有助于提升首页权重,参考 seowhy.com 的架构模式。

12、目前百度收录只剩2条、快照不跟新,有什么原因?

答:站内情况,主要跟站内内容及框架与更新规律有一定的关系。

13、<h4 style=”font-size: 24px;font-weight: bold;”> </h4> 这样的写法有影响吗?需要都统一放到css样式文件内吗?

答:这样的CSS样式H标签填写无误,最好都放入在CSS样式文件中。

14、 锚链接:http://www.t0574.com 与 http://www.t0574.com/ 有区别吗?统一好?还是不需要注意?

答:有区别,都全部用上 http://www.t0574.com/ ,注意后面要添加“/”。

15、<h1>标签里面套<a>标签,这样的做法可以吗?

答:可以。

16、SiteMap格式主做哪些就可以了?

答:sitemap.xml及sitemap.html这两种格式就可以了。

17、近期百度是不是周四小更新,周五大更新?

答:根据我最近的观察,最近一般都是周一、周四有更新。

18、<strong>与 <b> 哪个更适合用在主词上?

答:<strong> 的重要度级别比 <b>更高些。

19、加h标签的话,整行文字会换行,有可以控制的代码?

答:<h1 style=”font-size:12px; display:inline”><a href=”http://www.adminvip.net/“>创业之道</a></h1>
<h1 style=”font-size:12px; font-weight:normal; display:inline”><a href=http://www.adminvip.net/“ >创业之道</a></h1>
这两种代码插入都不会隔行一个是控制大小不变,一个是控制加粗不加粗。

原文