公告版位
新版Blog peichengnote

目前分類:tech_note (35)

瀏覽方式: 標題列表 簡短摘要

Get long live access token from Facebook - Stack Overflow
http://stackoverflow.com/questions/10467272/get-long-live-access-token-from-facebook
offline_accessパーミッション廃止時の対応 : Facebook開発者向けドキュメントの日本語訳とTips
http://facebook-docs.oklahome.net/archives/52047013.html




文章標籤

peicheng 發表在 痞客邦 留言(0) 人氣()

run apache mahout examples

官方網站上面有個有個說明,

Recommender Documentation - Apache Mahout - Apache Software Foundation
https://cwiki.apache.org/confluence/display/MAHOUT/Recommender+Documentation

To build and run the demo, follow the instructions below, which are written for Unix-like operating systems:

文章標籤

peicheng 發表在 痞客邦 留言(0) 人氣()


Hbase 使用zookeeper 管理 HMaster 與 RegionServer。
Hbase也就是從BigTable來的,當table大到一個程度的時候,table會split成一個一個的region。
而RegionServer就把 HTable 存到Hadoop的HDFS。
Google BigTable使用Chubby來負責協調Node的工作,而HBase使用的就是zookeeper。

Trend Micro CDC SPN Team | Client HBase RegionServer
http://www.spnguru.com/tag/client-hbase-regionserver/
HBase技术介绍 « 搜索技术博客-淘宝
http://www.searchtb.com/2011/01/understanding-hbase.html

文章標籤

peicheng 發表在 痞客邦 留言(0) 人氣()

create your own vmware image

cd ~/vmware
zip -r Ubuntu12.04.image_120921.zip Ubuntu/

Maybe can remove log file to save disk space
#rm *log

how to use
====
文章標籤

peicheng 發表在 痞客邦 留言(0) 人氣()

[note] 兩則 關於 搜尋引擎 搜索引擎 search engine

[转发]新浪网招聘搜索引擎研发工程师/数据挖掘和推荐系统工程师(实习生)
2012-07-17 16:33

职位:

搜索引擎研发工程师

职责:
文章標籤

peicheng 發表在 痞客邦 留言(0) 人氣()

[tech]淺談 partition sort (1

partition sort 就是一種Map Reduce的精神,
其實,在 Google 發表Map Reduce的paper 以前,
我想實際上有遇到"Big Data"的公司,都有這樣類似的解法。
只是後來Hadoop把這件事情吵熱了,
甚至紛紛使用了Hadoop,

不過我對Google內部使用的Map Reduce的framework還是,很好奇。

文章標籤

peicheng 發表在 痞客邦 留言(0) 人氣()

Private Cloud

關於一些設計上面的想法,
用最簡單的方式去完成最複雜的設定。

從使用者的角度出發,
能夠讓他們無縫的轉移使用者經驗。

從硬體上面的價格去支付軟體的開發。

peicheng 發表在 痞客邦 留言(0) 人氣()

NoSQL Data Modeling Techniques « Highly Scalable Blog
http://highlyscalable.wordpress.com/2012/03/01/nosql-data-modeling-techniques/

這篇文章作為NoSQL survey的總結,
之前就沒有看到又這麼詳盡的NoSQL概念性的介紹文章。

這個算是從基本的相關出發所做的介紹。

算是一整年survey的複習。

文章標籤

peicheng 發表在 痞客邦 留言(0) 人氣()

[DEnote]120505 Pattern Match Intro
文章標籤

peicheng 發表在 痞客邦 留言(0) 人氣()


增加修改的檔案

$ git add -u


or

增加單個的檔案

文章標籤

peicheng 發表在 痞客邦 留言(0) 人氣()

在jquery中
有選擇器

這個是選擇 ancestor 下的所有descendant(後代)

$("ancestor descendant")

這個是只選擇子元素

$("parent > child")
文章標籤

peicheng 發表在 痞客邦 留言(0) 人氣()

想不到過了兩年,
才慢慢覺得摸到IR的邊而已。

想抽出一點時間把目前所知的做一點紀錄。

IR 沈寂一時在Big Data的年代,他又好像消失,
其實他一直都在。
因為,Big Data是思維的再改造。
而真正核心的思想,就在IR裏面。

文章標籤

peicheng 發表在 痞客邦 留言(0) 人氣()


A
aa
dd
bb
B
cc
C
ee
在原始的資料結構要怎麼表示,
文章標籤

peicheng 發表在 痞客邦 留言(0) 人氣()

make something people want
i made something people want

唯一的門檻是勇氣

所以東西都在變成軟體,印刷機誕生後,
人類寫過多少個字,未來就有多少家軟體公司。


    搭建原型

peicheng 發表在 痞客邦 留言(0) 人氣()

TechWeb: 会不会有更多搜索厂商加入“情境”的发展中来?

孙良: 很有可能。“情境搜索”肯定是未来的一个趋势,而之前基于PC侧门户型的个性化搜索比较简单,只是根据用户在PC下留下的一些痕迹来考虑用户的兴趣爱好, 比如用户经常搜索的内容、搜索历史、浏览过的网页等。现在的“情境搜索”更加延伸,并能更好的解决用户的长期兴趣与短期兴趣的平衡问题。长期兴趣是指用户 所有的搜索过程中产生的一些痕迹,短期兴趣是指用户短期内会关注什么东西。比如说,用户长期关注股票证券类的投资信息,但是短期内,可能对世界杯比较感兴 趣。但是如果这两个方面的平衡没有把握好,搜索引擎还是以长期兴趣为主,协同过滤给出结果,这对用户来说就不是最优结果。情境搜索恰好能够解决这一问题, 不但考虑用户长期的兴趣爱好,还考虑短期所处的“境”,比如用户当时正好在看世界杯,或者说在看一些世界杯相关的信息,搜索引擎便会提供世界杯信息,而不 会还是提供证券类信息来干扰排序。这就是“情境搜索”与普通个性化搜索最大的区别。其他厂商后续也许会引入一些类似的技术,虽然未必会提出“情境”相关的 概念,但应该会越来越重视对用户本身的挖掘,因为搜索引擎本身就需要关注两方面数据:一是互联网上已有的数据,包含一些暗网数据;另外就是为了了解用户真 正想要的东西,所需要掌握的“情”和“境”。

TechWeb:“情境搜索“的行业意义是?

孙良:情境搜索指明了未来搜索发展的方向。这是因为搜索发展至今,一直没有解决好对人的理解,小小的搜索框是没有办法确切表达用户的信息需求的,所 以在这种模式下无论对数据侧如何进行加工,包括爬更多的数据量或补充更多的暗网数据,解决的都是数据的保有问题,而没有解决对用户的理解问题。也就是说, 在传统搜索框模式下,信息含量较小,信息密度不高,不足以表达用户的真正需求。而情境搜索则更多的考虑对用户本身的理解,它将提供符合用户应用场景、更贴 近用户的智能化搜索,这符合搜搜更懂你的发展战略,同时也代表着未来搜索的研究方向和目标。

TechWeb:“情境搜索“领域是否有1.0或2.0的发展版本之说?或者说有哪些发展阶段?

文章標籤

peicheng 發表在 痞客邦 留言(0) 人氣()

«12