第13回elasticsearch勉強会に参加してきました #elasticsearch #elasticsearchjp

このエントリーをはてなブックマークに追加
おはようございます!munepom (@__munepom__) です。
先日、第13回elasticsearch勉強会に参加してきましたので、ちょっとブログに残しておきます。

elasticsearch は、全文検索・解析サーバの OSS です。
私は、社内にある自身の開発環境で、LogstashとKibanaを使い、アプリサーバのログ検索に使っていたことがあります。
(メモリ容量が厳しく、現在は停止していますが。。。aha。。。)
手軽に全文検索が実行できて、嬉しいですね。
先月、AWS で"Amazon Elastic Service"が利用可能となったようですが、クラスターやノードの管理が楽になるのでしょうか?気になるところです。

勉強会の感想を書く前に、、、Honza Král さん、Takuya Noguchi さん、谷本 心さん、興味深い発表ありがとうございます!
また、内容モリモリな LT をしていただいた、株式会社はてな id:takuya-a さん、ありがとうございます!
毎度司会を務めていただいている @johtani さん、高速英語をリアルタイム翻訳していただいた @yusuke さんに大感謝でっす!

というわけで、講演の内容メモと感想でございます。間違っている可能性がありますが、その点はご容赦願います。

  • Beyond the basics with Elasticsearch
    • Percolator (濾過器) を使うと、クエリにヒットするドキュメントが登録された際、クエリを通知することが可能になるので、トリガーやアラートの仕組みとして使えそうですね。
    • RDBMS よりも、関連性の検索に優れているようです。Function Score。
    • Aggregation を応用すると、レコメンデーションもできます。
    • Sampler Aggregation というes2.0の新機能。集計対象を小さくすることで、早くすることが可能。という仕組みのようです。

  • How did we use Found.no for our services?
    • Found という、elasticsearch のホスティングサービスを使ってみた事例の発表でした。
    • AWS のサービスとどの点が違うのか、気になるところです。

  • ログ収集の仕組みを再考しよう! あとマウンテンビューに行ってきました。
    • ログですが、アプリからストリーミングハブへ渡し、そこからElasticsearchへ、というような流れが理想的ですね。たしかにー。
    • elastic 社の次なる戦略 (自分メモを要約しただけですので、誤記があるかもしれません。)
      • API
        • Task management API
        • Reindex API
      • Logstash 自体で、情報を保持するようにする流れみたい。入り切らなければ、データキューに入る、と。
        • Clustering
        • Persistent
      • Kibana
        • Custom Apps / plugins
      • Beats
        • Packetbeat
        • Filebeat
        • Topbeat
        • Beats シリーズは、Go で書かれているようですね。
      • Commercial plugin
        • Cross-stack monitoring / management
        • Cross-stack security
        • PDF reporting
        • Orchestration / Automation

  • Elasticsearch を使った単語共起頻度の計算
    • kuromoji.js を作った方ですか!
    • タグやカテゴリーと共起する単語をカウントする。ふむふむ。
    • ナイーブベイズは、転置インデックスと相性が良いみたいです。
    • Terms Aggregation や Filtered Query や Function Score Query 、Term Vectors API など、いろいろ使われているようです。
    • query 中で、Groovy スクリプトが書ける。最高。だそうです!
    • 共起頻度などのインデックス情報から、さまざまな確率が研鑽できるとのことです。

朝晩の冷え込みが厳しくなってきましたが、健康管理に気をつけてください!
Enjoy!
次の記事
« Prev Post
前の記事
Next Post »
Related Posts Plugin for WordPress, Blogger...