Google App Engine项目收集

Posted by & filed under Tools.

http://right.appspot.com/ 类似eemap的玩意 http://code.google.com/p/cpedialog 很不错的Blog程序 www.topea.net 外汇智能交易信号实时发布 http://im.huhaitai.com 仿twitter的一个应用,单用户 http://www.bus-line.cn 一个gae做的公交网站,现有北京 上海 南京 广州 天津 重庆 成都 深圳 等城市的公交线路。 http://my-todo.appspot.com/ 是任务管理, 适用于在 Firefox 侧边栏载入. 另外一个重要的特性是支持 Google Gears, 可以在没有网络的情况下使用. http://images.kangye.org 分享网络图片,挖图网 http://www.themv.cn LAST+YOUTUBE的应用,平时可以上去听听音乐 http://web-proxy.appspot.com 华丽的web proxy http://xiudaima.appspot.com 在线的代码高亮工具,只需复制粘贴就可以把高亮代码加入到你的Blog、邮件、Word中 http://ttlicai.appspot.com 天天理财网 http://proxycgi.appspot.com proxy http://uuopenchat.appspot.com 用django和jquery做的聊天室 http://sms4twitter.appspot.com 可以用短信更新twitter的玩意 http://gae-django-cms.appspot.com 一个简洁的CMS http://trygroovy.appspot.com/ 一个Groovy Web Console,带有一个交互式的Groovy学习教程。教程的输入界面完全实现了一个命令行窗口。输入下面教程的脚本,如果输入正确,教程会自动进入下一章。 交互式教程的形式受TryRuby启发,是对它的模仿。 http://rss4py.appspot.com RSS聚合 http://tedtalksubtitledownload.appspot.com/ 下载TED字幕 http://t.yibin.us 利用twitter… Read more »

Google AppEngine Launcher不能启动的解决方法

Posted by & filed under Operating System.

好久不玩 Google AppEngine,google 居然用WXPython整出一个带界面的GAE  server管理器,有点进步,虽然这个东西在Mac早就有了,至少现在不用在艳羡用Mac的同志了,当初我就觉得,难道google的工程师都用Mac?为啥不顾及大部分开发者呢?google真的太有个性了。down了一个到本地,结果死活加载不了项目,不停的报错,打开log一看,全是如下错误信息: Traceback (most recent call last): File “GoogleAppEngineLauncher.py”, line 42, in <module> File “wx\_core.pyc”, line 7913, in __init__ File “wx\_core.pyc”, line 7487, in _BootstrapApp File “launcher\app.pyc”, line 53, in OnInit File “launcher\app.pyc”, line 97, in _CreateModels File “launcher\maintable.pyc”, line 35, in __init__ File “launcher\maintable.pyc”, line 86, in _LoadProjects File “launcher\project.pyc”, line… Read more »

传说中的google新搜索界面

Posted by & filed under Study & Reading.

google新的搜索界面显得更加靓丽和年轻,继续进一步和百度拉开差距,估计不久就应用到google 中国的的界面上,目前你还不能通过正常方式访问到这个界面,如果想感受一下新界面,方式如下:打开www.google.com页面,记得,是google.com页面,如果跳转到google.cn页面,只要点击搜索框下面的“Google.com in English”即可,然后复制下面的脚本到你的浏览器地址栏,然后敲回车,再刷新google.com页面即感受最新搜索界面。 javascript:void(document.cookie=”PREF=ID=20b6e4c2f44943bb:U=4bf292d46faad806:TM=1249677602: LM=1257919388:S=odm0Ys-53ZueXfZG;path=/; domain=.google.com”); 关于google新搜索界面的更详细报道,请移步这个网站,E文的哦~~

Google Analytics官方在线培训与资格认证

Posted by & filed under Excellence Article.

从3月3日开始,Google推出了一个官方在线课程,培训主要的课程有Analytics的使用入门,报表解读,基本设置(有用信息过滤,电子商务跟踪,目标跟踪设置,多域名与子域名设置等等),还有 更高级的应用,比如自定义报表,报表切分,图表管理,趋势搜索,事件跟踪和真实页面浏览量,甚至是直接在代码中增加自定义参数。共有26个主题。 我对其中的多域名比较感兴趣,因为我觉得会有人利用这个多域名来作弊(刷统计数据),现在的广告主更相信第三方数据,如果这个真被用来作弊或者真的可以通过这个来作弊,很多广告主在选择大流量站点投放广告时又多了很多头痛的事。 另外,在课程完毕之后,官方还提供了一个测试(IQ test – Individual Qualification test)来证明你是否是个合格的Google Analytics网站分析人员。 不过要参加这个资格测试还需要花费50美圆,课程都是全英文的,测试当然也是,通过75%的测试就被认为合格。其实,个人觉得参加测试是没有啥意思了,不过课程是肯定应该去学习一下的,毕竟访客分析对于商业网站的运营是越来越重要了,学好了Google Analytics对你分析访客数据提高网站的可用性都是非常有帮助的。另外对于使用Google Analytics来跟踪Adwords PPC广告数据的朋友也应该去听一听,这对你控制广告预算,减少无效关键词的广告支出,>跟踪PPC广告的转换关键词,提高ROI都是非常有好处的。 如果有兴趣在课程结束后参加测试的朋友的话,可以参考Google Analytics IQ的FAQ,我大概看了一下,通过后IQ资格为18个月的有效时间,时间过了也许还需要重新测试吧,FAQ中也没有提到通过了会发证书,所以想拿“文凭本本”的朋友估计没戏。哎,在中国,本本还是挺重要的啊!哈哈…,不过对于在家工作的朋友来说,学到真本事才是真的,个人觉得web分析技术要比网站的SEO重要得多,要想成为web分析领域的专家可不容易。

地主家也没有余粮了

Posted by & filed under Study & Reading.

Google App Engine Blog公布了具体收费细节的同时也公布了一项大幅削减免费用户资源的方案,收费方案和之前坊间传说的差不多: * $0.10/CPU core小时 * $0.15/每月每GB空间 * $0.12/每GB输出带宽 * $0.10/每GB输入带宽 * $0.0001 每封发出的邮件*每个收件人 同时免费资源削减为: CPU Time: 6.5 小时每天, 现在是46小时 (WTF!) Bandwidth: 进出共1 GB 每天, 现在是进出各10GB (WTF!) 之前Google曾削减过员工数量,并终止了很多项目,最有名就是Google Notebook,我是Google Notebook的忠实用户,我还指望Google Notebook哪天推出更多的功能,现在Google又加紧了APP engin的商业化步伐,一向财大气粗的Google,现在也开始精兵简政,开源节流了,看来地主家也没有余量了。 更新: CPU Time 通俗的讲就是占用CPU大部分资源的时间

晒一下“奋斗足迹”访问者浏览器分析

Posted by & filed under Study & Reading.

从07年4月燃起写博客的欲望之后,中间经历了很多,甚至有放弃的念头,但每每受到各种诱惑,最后还是坚持下来了,今天起得很早,闲来无事,看看几乎快忘记的Google Analytics,曾经我用过yahoo统计,51啦,最后在师傅的强烈影响下,挂了Google的代码,事实上之前我曾挂过Google分析代码,但当时博客放在dreamhost,本来打开就不快了,Google的代码加载还需要那么长时间,最后下决心给弄掉了,这个毛病到现在Google也没改掉,不过还好,花开同学的慷慨,让我挂在河南最好机房中,虽然是网通机房,从我得到的测试数据来看,教育网和电信访问速度都还可以,当然,这其中也有cost-html-cache插件的功劳,让我得以将访问量比较大的几个页面给静态化了,页面打开速度也有很大提升,另外感谢firebug 和针对firebug插件的插件Yslow,firebug让我优化了不少CSS,尤其是针对IE6的优化,YSLOW给出的建议让我受益匪浅。 一番啰嗦之后,具体看看数据,从08年8月挂了Google analytics代码之后,数据显示每个星期的平均访问量为650左右(流量少得可怜,呵呵),总的访问量我没找到在哪里看,看来要好好学学了。 估计是我总是写一些技术方面的文章的原因,访问我博客的浏览者使用非IE核心的浏览器居然超过43%,令我惊讶的是连chrom这个新的浏览器都占6.19%,具体数据请看下图 firefox用户高达33.71%,看来火狐在开发人员中还是相当受欢迎的。 同时我也看到另外一个数据,访问我博客最多的地理位置是广东和上海,其次是北京和杭州,这刚好符合中国的IT产业格局,广东、上海、北京是中国IT的产业中心,其次是类似浙江这样的正在赶超的省(市),当然也存在另外一种可能就是:广东、上海、北京这几个城市比较发达,拥有电脑的人数和成熟网民的例比较高,不过这种可能对我的博客来说几乎不存在,因为一般的用户不会来我的博客,特别是我的博客流量很高比例都来自Google搜索,一般网民比较喜欢用百度。

Google Reader 界面更新

Posted by & filed under Study & Reading.

大清早起来,看到firefox的状态栏中有几个更新,点开一看,吓了我一跳,我还以为我的Google Reader 被 ABP给Block,禁用了插件之后还是这样,再仔细一看,上面有一段小小的提示: New! Things look pretty different around here. Learn more about Reader’s fresh new look. 汗一下,原来是更新了,顺着链接去官方博客看了一下,原来增加的功能还真多 Each section of the navigation pane now has its own options menu and minimize/maximize controls。(每块视图都有自己的选项菜单和最大化最小化控制按钮) Shared items have grown up and gotten their own section in the navigation pane.(分享列表已经升级并且在导航中增加了自己的选项) Feed bundles are small sets of feeds… Read more »

自定义Google搜索引擎—-美化

Posted by & filed under Programming.

好几个朋友之前问过我有关Google自定义搜索的美化,之前我一直在Bus工作,只是在QQ上应付几句完事。现在刚好请假,有点时间,自己弄了一下,发现其实一点不复杂,只需要基本的HTML知识就可以搞定了。 问我自定义搜索的朋友大致有两类,一个是嫌程序本身自带的搜索太烂,比如wordpress就是,还有一个是为了赚$,当然这个需要和Google Adense帐号绑定,本文不打算介绍这部分内容,因为我的Adense帐号不知为何故就被Google告知作弊,然后就莫名其妙的封掉了,我对天发誓,我没有做过弊,帐号中仅有的几美元也随之飞灭,从此我对Google Adense失去兴趣。 要自定义Google搜索,首先你当然需要有个Google自定义搜索,没有的同学,可以去这里申请一个,过程超级简单,Google有帮助功能,此处略去数千字。

ghs.google.com不能访问解决办法的解疑

Posted by & filed under Study & Reading.

近日,有读者在我的 ghs.google.com不能访问解决办法 这篇文章的后面留言说: Google 公司的所有域名服务都和 ghs.gogole.com 有关,而经很多人证实我国伟大的GWF把 ghs.l.google.com 结封杀了…… 对 ghs.google.com 分析研究后发现,ghs.google.com 这台服务器并没有提供实质性的服务,而只是选择访问者访问最快的服务器(Google全球性公司,很多地区都有服务器),我通过代理找到这么一台服务器 tw-in-f121.google.com,发现它并未被封杀,这样只需要在设置域名别名为 tw-in-f121.google.com 取代 ghs.google.com 即可。 我的立场是:不推荐大家这样去做。 基于如下理由: hs.google.com只是一台(或者说是一组)用来做代理镜像的服务器(主要作用是寻找和用户最近的同步节点),将cname记录转发到tw-in-f121.google.com是将域名某台具体的服务器上,这样做是比较危险的。 第一,Google解析系统不能按照用户的IP地址来自动选择最近的同步节点供用户访问,可能导致不同地区的访问速度差异很大 第二,如果这台服务器出了问题,那么解析将会中断 第三、tw-in-f121这样的二级域名是经常变换的,因为它是Google公司的内部命名,随时有可能更换,如果被更换,同样不能解析,服务依然不能访问 第四、不能解决服务均衡问题,如果大家都将cname解析到tw-in-f121.google.com这个域名下,将导致服务器负载过大,可能会造成解析拥堵,效率和速度下降,甚至会导致拒绝服务 截至目前为止,我在以前文章中提供的IP地址仍然是可以用的,请各位放心使用,如果有变更,我会及时的在博客中贴出来

关于搜索引擎原理

Posted by & filed under Excellence Article.

我知道这个问题很宽泛 … 也知道这不是一两句话能说清的 … 但是我还是想知道搜索引擎获得结果的原理 … 我有无数个爬虫爬下来一千万条也就是 10M 条的文本 … 现在我要从这 10M 条文本里面获得含有特定字符串的内容 … 分词或其他都不考虑 … 就是有 strpos 特定字符串的文本返回 … 搜索引擎是怎么做到的呢 ..? 一般的搜索引擎你输入关键字之后结果非常快就反馈出来了 … 但是在后台它是如何操作的 ..? 因为待搜索的内容是不确定的 … keyword 索引这种方法显然不可行 … 那么遍历存储的每一个文件 …? 这样的效率真的会比 MATCH AGAINST 高么 ..? 另外说哪怕没有任何记录搜索引擎也会很快提示 Not Found … 如果说一次扫过 10M 条记录 … 数据读取速度也和硬盘转速也是瓶颈 … 不可能有这么快的响应 … 或者是 1k 台服务器的集群 … 每台服务器负责搜索… Read more »