INPUTしたらOUTPUT!

忘れっぽいんでメモっとく

Neo4j 説明会に参加してきた

グラフDBがレコメンドや不正検知にも使えると聞いてNeo4j説明会に参加してきたのでメモしとく。


Neo4jユーザグループからのお知らせ(案浦氏)

今後の活動について

各地区での活動

  • 関東、九州はOK
    • 他の地区大募集
  • 現状の推進体制
    • 幹事2人
    • スタッフ2人
  • 絶賛メンバー募集中


Neo4jの紹介

COOのLars Nordwall氏直々のご説明

NeoTechnology Overview

  • 2007年に8人?で設立。
  • 様々な業界で適用されている
    • 金融
    • 通信
    • 小売り(EC、リアル)
    • etc...
  • スタートアップからエンタープライズまで幅広いレンジの会社で採用されている
  • 最初の説明会/勉強会の参加者は2人だったが今では週に20回ほど世界で勉強会が開催されている
  • Neo4jを基盤とするアプリ・サービスが増えてきている
    • median?
    • elementum?

Customer Case Studies

  • die Bayerische
    • ドイツの保険会社
    • 保険の商材、顧客数が膨大でIBM DB2で処理できなくなってきた
      • 住宅保険の場合、住居の広さや顧客情報、地域・気候など関係が複雑でRDBでの処理が困難だった
    • NoSQLの選択肢の1つだったがプロトタイプの結果が良かったのでDB2の全面リプレースになった
    • プロトタイプから本格運用の期間は?
      • 6ヶ月
      • 保険業界という厳格な業界で、厳格なプロセスを重要視する会社で、ドイツという厳格な国民性
      • 2週間でプロトタイプを作成
    • DB2でできなかったことは?
      • リアルタイムで的確な商材を抽出できた
        • DB2では見積もりを出すのに1週間要していた
  • Telenor
    • ノルウェーの通信会社
    • 法人の相対契約や家族の契約などでプラン、顧客、法人の管理者・グループの組み合わせが数百万にもなった
      • 過去の履歴も保管する必要があり膨大な数になった
    • ログインに数分かかる
      • 苦情が増え解約につながった
    • ダイナミックなプランの変更に対応できなかった
      • 1日前のスナップショットからリアルなデータを参照できるようになった
    • ツリーモデルからグラフモデルになってきたがSybaseでは大量のJOINが発生しパフォーマンス劣化
  • CrunchBase
    • スタートアップ企業のデータベースサービス
    • MySQLからNeo4jに移行
    • 検索パターンの多様化に伴いMySQLでは対応できなくなってきた

      Why?

  • Linkedin、GoogleFacebookPaypalなどはグラフDBをコアにしたエンジンを独自に実装している
  • レコメンドエンジンを実現するのにもグラフDBは効果を発揮する
  • 設計したものがそのまま実装しやすい
    • ホワイトボードに書いたダイアグラムがそのまま実装できる
    • エンジニアだけではなくビジネスユーザーが書いたものを実装できる
  • シンプルなデータ、変化のないデータであればMongoのようなDBでOK
  • 関係が複雑なデータ、複雑化していくデータはグラフDBの方が良い
  • RDBではレコードが増えるとJOINの負荷が高くなる
    • RDBで大量のJOINを書くと大変だがCyperQueryだとシンプル
    • eBayでは数ページのSQLを数行のCypherQueryに変換できた
  • HA構成だと高いが安くならないか?
    • community
    • enterprise editionではクラスタリング機能などがある
      • startup edition 年商5億円未満では無償
  • 不正検知デモ
    • 45万ノード、45万リレーション
    • 時間切れで途中終了。残念。。。


Cyper QL(Query Language)の使い方

  • 多能性
    • グラフDB = RDB + ドキュメントDB + ビジュアライズ
  • Neo4jドライバー
    • Rが使える!
  • CSVJSONからノードの登録ができる


Graph Databases(書籍)について

  • ちょうど今日(3/11)からAmazonで予約開始
    • 発送は3/25
  • O'Reilly直販だと3/20ごろから発送

グラフデータベース ―Neo4jによるグラフデータモデルとグラフデータベース入門

グラフデータベース ―Neo4jによるグラフデータモデルとグラフデータベース入門


Neo4j日本国内での事業活動について


  • グラフDBってソーシャルネットワーク分析しか想像していなかったけど適用範囲が広くて参考になった
    • レコメンドとか不正検知とかマスターデータマネジメントとか
  • サイコグラフィックやライフスタイルをグラフDBでどのように表現できるか試してみたい