Archive for the ‘未分类’ Category
阅读:漫画与文本的互相促进
2009-12-11《九鼎记》是起点上著名网络作家‘我吃西红柿’的新作,追捧者众多。我从了解此书之名气也已有4个月了,却只看了前面二章后没有继续下去。
原因有2:
》此书一开始部分的内容有点怪,不象传统的武侠;因此并没有深深吸引我,产生继续下去的激动;
》我的时间非常有限,而此书必然又是大部头。我担心阅读的性/价比不高,所以处于观望状态。
但是昨天的另一件事,让我产生了阅读此书的欲望,就是《九鼎记》的漫画版。
昨天我进入起点的漫画频道,进行研究。《九鼎记》的漫画版排列在醒目的地方,之前对《九鼎记》又怀有兴趣,于是决定阅读一下。我将它加到‘我的书架’中,然后点击阅读。
故事相当精彩,画笔也了得(在我这个外行眼中绝对是),我情不自禁地被吸引了进去,一口气就读到了底。漫画的特点就是精练,文字相当少,每章也就4~8幅图,就可以描述出一段情节(基本上以前的一章,对应现在的1~2组漫画),所以阅读速度相当快。全部298章读完,也只花了2个小时。延续起点的特色,这个漫画也是连载的;我的胃口也被它吊住了。就象今天,我不得不再次进去看更新章节。
尽管《九鼎记》的漫画版尚未结束,我也已经对《九鼎记》文字版产生了强烈的兴趣;估计这个周末有一部分时间要交给他了。
继续研究起点的漫画频道,发现
1)《九鼎记》的漫画版的作者并非‘我吃西红柿’,而是一个番茄的粉丝 — 其实这很合理,术业有专攻嘛,漫画的核心能力是‘画功’
2)除了《九鼎记》外,其它热门书籍如《阳神》、《鬼吹灯》都有人为其制作漫画版。
3)热门作品的漫画版本,同样在漫画频道的人气较高。并且,读者大部分为原先作品的爱好者。
所以,我认为:
》漫画与文本作品,是互补的,可以交叉营销!
》这与小说与电影、电视、游戏的相互关系是一致的!《鬼吹灯》、《星辰变》、《与空姐同居的日子》就是典型代表
》进一步地,这些原创作品可以/应该从全版本的角度来考虑运营,从而为作者谋求更高的利益回报。
===== by 鬼谷子@魔教,更多内容在 http://DavyYew.BlogBus.com ======
一个Excel技巧,及其蕴含的编程规范思想
2009-12-10神相同学总结了‘用OFFSET和COUNTA实现动态增加下拉列表’的Excel技巧,大家都可以学习一下。
这项技巧中,一下子就提供了3个优点:
》元数据单独定义,便于维护
》使用‘命名’来定义区域,便于其它地方引用
》利用公式来保持伸缩性(自动去除空格)
事实上,这与软件开发是相通的,可以对应到软件开发中的一些优秀编码规范:
》数据抽象、
》定义独立、
》维护与应用分离!
PS:
1,对上述技巧补充几个小建议:
a)元数据TAB我起名叫’Meta’,比’Config’更贴切一些
b)这个名称叫set_PM或者PM_set,PMs更好些
c)集合中,留一个[空白]或NULL或N/A或?,会更好些
2,我们应该及时记录、整理,积极分享
3年前我在做‘阿里软件网店数据分析’时就使用这些技巧,建立了一些清晰而便于维护的EXCEL文件,成为模板。
其其也曾将这些技巧开发成一个培训课件。
可惜那时候,我没有象这样积极地写BLOG;否则,大家早就应用上了:(
电子书格式,ePub将是趋势
2009-12-09当前业界通用、流行的格式主要有:
- 》 TXT:优点是各种设备都支持;缺点则是只能显示文字,表现力太单调。
- 》 PDF:表现力丰富,绝大部分设备都支持,是目前的主流格式。 PS:亚马逊电子书开始升级支持PDF格式软件
- 》 ePub:一个基于XML的电子书发布格式标准,由IDPF在2007年制定。
我觉得,ePub将成为事实上的标准。因为:
1)此格式本身简洁、合理(参见后面的资料),
- 》由于内容是以XHTML表达的,表现力很丰富:文字、图形、表格、声音、
- 》对HTML,目前各平台上都有屏幕展现支持。即使对于手机,解释速度也很快 — 相较于PDF与Post Script,这是很大的优势
- 》各设备上较容易开发出支持的应用软件(阅读器)
2)此格式具备伸缩性与功能扩展性
- 》内容组织结构:体现了书、部、章、节,最小部分为独立的文件;可以很好地支持完整书与连载书 — 这是电子书的特色
- 》版权保护:内置了支持DRM版权保护与内容加密的协议
2)获得了巨头的支持
- - Google已经推出此格式的100万本书
- - 电子阅读器排名第二的Sony于2009/8/14采用此格式
- - 此格式已经被许多硬件制造商,出版公司和零售商采用。
附ePub资料:
1)ePub标准概览
EPub是一個自由的開放標準,屬於一種可以「自動重新編排」的內容;也就是文字內容可以根據閱讀設備的特性,以最適於閱讀的方式顯示。EPub檔案內部使用了XHTML或DTBook (一種由DAISY Consortium提出的XML標準)來展現文字、並以zip壓縮格式來包裹檔案內容。EPub格式中包含了數位版權管理(DRM)相關功能可供選用。[1]
EPub於2007年9月成為國際數位出版論壇(IDPF)[2]的正式標準,以取代舊的開放Open eBook電子書標準。EPub包括三項主要規格:
- 開放出版結構(Open Publication Structure,OPS)2.0,以定義內容的版面;
- 開放包裹格式(Open Packaging Format,OPF)2.0,定義以XML為基礎的.epub檔案結構;
OEBPS容納格式(OEBPS Container Format,OCF)1.0,將所有相關文件收集至ZIP壓縮檔案之中。
2)开发教程:《使用 EPUB 制作数字图书》https://www.ibm.com/developerworks/cn/xml/tutorials/x-epubtut/index.html
===== by 鬼谷子@魔教,更多内容在 http://DavyYew.BlogBus.com ======
[CTO札记]Cloud Computing实例:搜狗云输入法
2009-11-21说起Cloud Computing,似乎总给人一种‘宠大无比’的感觉,但我认为并非如此。
如果你能以互联网为中心,将WEB上的某种业务资源聚集到一起,再快速反馈给用户,就构建了一个Cloud的计算/业务模型。
之前的‘云安全(杀毒)’是如此,最近的‘云输入法’也如此。
我想象中的文字标记(发音、语调)也可以往这个方向发展,希望这能给SDI的同事一些启发。
—————-下面转载一篇关于‘搜狗云输入法’的文章——————————————–
作者:小焱发表时间:2009年11月11日
随着云计算,云安全等一系列带“云”字的时髦网络词汇相继闯入我们的生活后,输入法这个看似貌不起眼的小软件也坐不住了,最近,搜狐公司旗下的搜狗推出了云时代的输入法:搜狗云输入法!
搜狗输入法作为一款成功的互联网软件,其核心优势在于其强大的互联网词库、精准的智能组词算法,两者的结合让用户输入命中率达到91%以上的空前水平,然而,即便如此,用户的输入仍未达到尽善尽美的地步,剩下的不到9%的输入,是否已经成为现有输入技术的瓶颈了呢,是否搜狗就只能止步于此了呢?
答案是否定的,云计算给出了另一种可能。
云计算是一个新兴的商业计算模型。利用高速互联网的传输能力,将数据的处理过程从个人计算机或服务器移到互联网上的计算机集群中。这些计算机是普通的工业标准服务器,由一个大型的数据处理中心管理,数据处理中心按用户的需要分配资源,达到与超级计算机同样的效果。
“云”,既是对那些网状分布的计算机的比喻,也指代数据的计算过程被隐匿起来,由服务器按你的需要,从大云中“雕刻”出你所需要的那一朵,实在是非常浪漫的比喻。
搜狗云输入法就诞生于这样的一个“云”时代。
搜狗云输入法是什么?
顾名思义,云输入法即通过网络来进行使用的输入法,其使用界面和现在的搜狗没有太大差别,但是(其实现在的云输入法本身的表现也是一个网页)与一般输入法最明显的区别在于,没有安装包,没有本地输入法文件,完全靠服务器支持,这就像互联网上的一个网站,只要打开了就能享受到你所想要的服务——搜狗云输入法,正是“云计算”的雏形。
一直以来,桌面输入法需要考虑到用户机器性能,用户下载成本等多种因素,因此桌面输入法的特点是:小而精。小的意思是,语言模型的信息量尽量的小,以减小用户安装包的大小和保证用户输入时的音字转换效率;精的意思是,桌面输入法从用户的常用性角度上做了很大优化,因此即使再小,用户相对比较常用的短句(用户输入数在8左右)基本可以保证正确无误的输出。但是当用户的输入不很常见的时候,比如很多专业长句,文言文文章的时候,那么桌面输入法就不能带给用户很好的体验了。
所以,为了突破这种限制,搜狗云输入法应运而生,把大部分工作量从客户端桌面转移到服务器,由服务器来为用户提供最好的体验。
搜狗云输入法怎么用?
正如我们上面所说的,无须下载、安装和升级。目前为止你只需要打开你的浏览器,通过添加一个小小链接,就能够使用搜狗云输入法——在任何你打开的网页。
首先是把云输入法的链接加入浏览器的收藏。这就和添加一个普通的网站链接一样简单。为了您更方便地使用,推荐把这个收藏的链接安排在可以直接看到、方便点击的地方,这样,您就有了一个云输入法的“启动按钮”。
然后可以立即在任何您想输入的网页内,用“启动按钮”,切出搜狗云输入法!
几步简单的操作,就可以使用最“方便”、“绿色”的输入法——搜狗云输入法
搜狗云输入法是如何实现的?
简单的使用方法,不简单的技术含量——搜狗云输入法在硬件和软件上都突破了桌面输入法方面的限制。
云输入法计算存储平台都是内存巨大计算能力强大的服务器,因此其存储的词库和语言模型库从理论上可以无限大(目前我们的语言模型库是2G,桌面模型库只有15M,词库上我们目前规模是200w,而桌面词库规模是不到40w,下一步我们也会把更多的可信任专业词库加入云输入法词库中);同时由于计算能力强大,为了让计算结果更准确,我们在云输入法中采用了3元语言模型和带有语义特点的trigger模型,未来如果有需要,可以采用更长的4元以及5元模型。在单台服务器的基础上,我们进一步会同时部署多台服务器,并且考虑负载均衡等各种服务器协作的原则,这其实已经具有了云计算的特点。
搜狗云输入法给我们带来什么?
减少用户时间成本,让下载、安装、升级的琐碎事情均被一笔勾销;
减少用户本地资源的消耗,让普通硬件水平的用户也享受到强大的搜狗输入法的服务,无存储之忧,无性能之患;
让我们来看看搜狗云输入法将向用户展现的自然语言计算处理能力,是如何强大。
因此与桌面输入法相对,云输入法的特点是大而全,同时可以再加一个字“准”。桌面输入法可以计算出来的全部准确结果,只是云输入法的一个很小的子集。
从评测上,新闻长句评测集合在桌面输入法上首选率只有60%,而在云输入法上可以达到80%,并且不能首选的那部分case有一半从语义上完全可以接受(语义正确率大概可以到90%);用户短句的云输入法首选率在96%左右,桌面输入法只有不到93%;用户短句的云输入法候选率在99%以上,桌面输入法只有不到94%。
同时,桌面输入法几乎不可能通过组词输出的某些句子,云输入法都可以做到,比如孙子兵法中的句子“夫兵形象水,水之行避高而趋下,兵之形避实而击虚;水因地而制流,兵因敌而制胜。故兵无常势水无常形。能因敌变化而取胜者谓之神”,或者皇帝内经中的句子“余闻上古之人,春秋皆度百岁,而动作不衰,皆谓之虚邪贼风避之有时,是以嗜欲不能劳其目,淫邪不能惑其心”等,都是通过三元组词模型做到的。可见云输入法组词计算能力何等的强大。
从表现上,我们的云输入法没有对客户端做任何限制,只是指定了一种网页通信方式,在这种网页通信方式下,任何第三方操作系统,软件或者通信硬件,都可以通过直接和我们的云输入法相通信得到其想要的计算结果,这样进一步增进了我们“云计算”的特质,(也可以作为一种商业模式)。
搜狗云输入法代表了什么?
云输入法之所以能做到如此的大,全,准,靠的是搜狗强大的技术实力。
我们通过搜索引擎抓取训练语料,当前训练语料的规模是上百G的文字语料;
我们通过精准的分词技术对句子进行精确拆分,以构建准确的语言模型库;
我们通过强大的滤噪能力把语料中的错误去除,以优化我们候选项的质量;
我们依靠多年来在桌面输入法上累积起来的成功经验进一步优化云输入法的计算品质。
总之,搜狗云输入法是一个搜索引擎和自然语言处理的集大成者,具有云计算的特点,代表了未来技术发展的方向。
不知道后面还会出现什么带“云”字的产品,云QQ?云OFFICE?云影音播放?……看来,互联网真的要把我们全面带入云时代了
搜狗云输入法官方地址http://pinyin.sogou.com/cloud/
===== by 鬼谷子@魔教,更多内容在 http://DavyYew.BlogBus.com ======
[CTO札记]从文章->图->关键词,谈传播的有效形式
2009-11-12图有利于理解(所谓一图胜千言嘛)。几天前,我用图来整理了预防H1N1的一些方法,BLOG友人反馈‘通俗易懂’。
但是,对于传播来说,图未必是最佳的表达形式。
传播涉及到传与收双方,
传送通常有2类方式:
- S1》口口相传
- S2》电子方式(Email, Blog, MicroBlog, IM状态)
对于接收者来说,也有二类方式:
- R1》耳闻
- R2》目睹
然后我们来看几种表达形式:
- D1》文章(大段文字)
- D2》图/表
显形,D1(文章)不适合于S1(口传);而D2(图/表)不适合S2中的微博,也不适用于R1(耳闻)。
所以,我要补充一类新的表达形式
- D3》关键词(短语、对联、诗)
如果关键词能够做到短小的同时,加上汉语文学的一些美感(形象、对称、押韵等),就可以做到通俗易懂(利耳闻)、朗朗上口(利口传)。
Samples:
1)防甲流3字经: 少出门,戴口罩,勤洗手,多吃桔。
2)SDO目前在做一个项目,很欣赏它们的二个关键词“精于心、薄于形”。
这个项目的内容是相当多,光是Mind图整理出来的要点就有100项目。但核心就是要达成“高效(扩展性、可靠性、高速)、易用(调用简单、管理方便、维护有序)”。
“高效、易用”也是不错的关键词,但“精于心、薄于形”更形象。
同时,因为这是某品牌手机的广告语,不少人已经沉淀于脑中。借助于此,这个项目的目标易于传播、深入人心!
3)魔方复原法《3字魔经》。
1小时能够教会一个新手!要知道,通常学会至少4小时。
靠什么?靠的就是:有趣形象的故事(通俗易懂)、改编成的3字口诀(朗朗上口,易记易教)。
===== by 鬼谷子@魔教,更多内容在 http://DavyYew.BlogBus.com ======
[CTO札记]FaceBook的获利方式
2009-11-11FaceBook目前是不是赢利还说不清,不过未来的确存在这些机会。
我们可以从下图来看作为SNS平台运营商的FaceBook与相关角色之间的关系。

图片来源:http://www.to-marketing.com/affiliate-marketing/3771
从图中的现金流可以看出FB的几种获利可能(我也说明一下它的当前状态)
1》广告主/广告代理 — 目前主要收来源,但FB严格控制数量,所以总额有限。
2》用户:免费 — 收费是很危险的
3》APP:分成或者平台使用费 — 最合理也最易被APP开发商接受的计费方式当然是‘分成’,目前FB尚未开收。
4》调研机构:数据/报告使用费 — 这是小头
5》网络运营商:负支出 — FB的量相当大,可能议价能力会强一些吧。也许也会象Google那样自建庞大的IDC。
图中没有画一种可能的收费方式:
6》FB自己开发的APP — FB目前明确表示,不进入这个领域。
就象QQ将‘开心农场’抢过来,变成‘QQ农场’、再扩展一个‘QQ花园’。这同样危险,犹如球队老板亲自上场、球员不敢使真力一样(上海足球就有活生生的例子)。
一个相反的例子则是:Alibaba/TaoBao掌握了大量的交易信息(完全知道何种商品好销、利润高),但从未自己去开一个网上公司/商品。
对于互联网来说,‘信用/诚信’难建易破,是立足与长青之本!
我个人比较看好方式1与3!
===== by 鬼谷子@魔教,更多内容在 http://DavyYew.BlogBus.com ======
[SD2C 2009]开放平台沙龙:论开心农场变身QQ农场
2009-10-26晚上的沙龙上,突然听闻:开心农场变身为QQ农场(Tecent赶走了开心农场,自建QQ农场)。
我对此的评论是:Tecent在开放上缺乏诚意!
1)Tecent在开放一事上,步子很慢。那是因为它一直处于优势地位,不需要通过开放来增加利益。–前文我谈过,利益是平台、开放的驱动力。
2)Tecent尝试‘开心农场’,是感觉到了来自开心网的压力。SNS的迅猛发展,谁也不敢小视。如果不是FaceBook、开心网惊人的发展速度,Tecent连尝试都不会有。
3)如果说‘开心农场’在面对QQ海量用户时,产品质量、性能存在问题,合理的平台商态度应该是帮助。从技术上、人力资源上、资金上,帮助它。但是踢走‘开心农场’再自建‘QQ农场’,给人的感觉自然是。一个最好的创意、最成功的应用被拿走了,其它人还敢跟你玩吗?
PS:有一位在场的Tecent朋友对此很敏感,觉得上纲上线了。
我是就事论事,发表了这个观点。我对Tecent是相当敬重的,用词上也只是‘缺乏诚意’,而不是其它更严重的‘抢占’、‘垄断’、‘诱骗’之类。
我理解这位朋友的爱司之情,但是感觉很遗憾。在业界公共交流的沙龙中,谈论‘开放’的内容,抱有开放的心态,或许可以得到更多有价值的东西。
所以,在此后的讨论中,我的发言减少了很多,并且不再谈Tecent。
===== by 鬼谷子@魔教,更多内容在 http://DavyYew.BlogBus.com ======
[SD2.0大会]温昱:平台开发-软件企业做大之道
2009-10-24Agenda
- 什么是平台
- 软件平台与重用
- 重用的事实与谬误
- 大粒度组装,小粒度定制
- 软件平台与业务
从大家熟知的“平台”开始
- 本次SD2C大会
- 北京晚报
- 新浪网
- 淘宝网
- 上海地铁IT时代报(免费)
何谓平台?
- 市场一方《—》平台《–》顾客一方
提问:菜市场是不是平台?
汽车业的平台
平台的组成
- 参加框架
- 可重用资产
- 代码相关
- 代码无关
- 文档
- 模型
- 。。。
。。。
这个培训太无聊了,10多年前的东西还在老生常谈:(
===== by 鬼谷子@魔教,更多内容在 http://DavyYew.BlogBus.com ======
[SD2.0大会]第二天的精彩课程:云计算、大型网站架构、SNS游戏
2009-10-23听了今天的几个课程,相当不错。
1)SINA的云计算
让我非常惊叹的是:SINA不仅仿照Amzaon AWS,实现了大部分云计算的组件(居然连名字都一样:S3, SDB, CloudFront),而且实际应用到SINA网上了!
Alibaba要加油了。
2)淘宝的架构改造
黄裳(岳旭强)的Speach很好,不在于一些技术细节,而在于其总结的架构策略。对于一个超大型网站,架构一定是要有策略思想的。没有思想,那些点滴技术、产品,表面上很花,但肯定不能适应快速发展、长期发展。
3)Amazon 云计算(AWS)
如果不是印度英语对很多技术人员的障碍,我强烈建设大家复习一下这个演讲。有3个优点:
》完整地介绍了AWS,及其上应用开发的要点。
与去年仅仅EC2、S3相比,AWS目前已经相当丰富与成熟。大家应该详细了解这些内容。
》优秀的PPT
应该说,这是本次大会制作最好的一个PPT。我也在最后注意到了‘Presentation by @simon’,可能是一家专业公司帮助制作的。
》激情的演说
这个印度于不愧为Tech Evangelist,演讲娴熟、激情。
4)晚上的沙龙:揭密Social Game开发
李大维对FaceBook等SNS网站上APP的情况相当熟悉,用大量实例剖析出了成功Social Game的特点与发展趋势。
详细的内容以后补上。
===== by 鬼谷子@魔教,更多内容在 http://DavyYew.BlogBus.com ======