「 ビッグデータ技術 」一覧

[備忘録] 異常検知モデルの意味論における自己符号化(Auto-encoder)の機能

[備忘録] 異常検知モデルの意味論における自己符号化(Auto-encoder)の機能

問題再設定:映像データを対象とした異常検知問題の枠組み 分類モデルの応用によって異常検知モデルを組み立てる発想はありふれている。しかし、監視対象が時系列的な信号データや映像データである場合、分類モデルの設計者は次の三つの問題と向き合わなければならなくなる。 1. 教師データのアノテーションコストが高まる。分類モデルでは、最低限「正常」と「異常」を区別できる教師データのアノテーションを用意し...

深層自己連想器による派生主題のレコメンド

深層自己連想器による派生主題のレコメンド

人工知能エージェント:キメラ・ネットワークに、深層自己連想器を活用した派生的な主題のレコメンド機能を追加した。深層自己連想器は深層ボルツマンマシンを積層自己符号化器として活用した連想器で、既に人工知能エージェント:ヒューズ=ヒストリアには組み込んでいる。キメラ・ネットワークは多値論理学的にファーストオーダーの観察をセカンドオーダーの水準から観察することで、そこで導入されている区別によって排除された...

五感に訴え掛けるマーケティングの宗教的なブランド戦略

五感に訴え掛けるマーケティングの宗教的なブランド戦略

マーティン・リンストロームによれば、ニューロ・マーケティングは科学とマーケティングの歴史的な融合をもたらした。それはこれまで支配的であったマーケティングのパラダイムを展開させることになったという。 リンストロームによると、従来のマーケティングは憶測のゲームに過ぎなかった。偶然にも成功した広告は、結果的には成功する運命にあったと言った具合に、好都合に解釈されてきた。ニューロ・マーケティング以前...

思い出した時に何を忘れるのか

思い出した時に何を忘れるのか

Twitterの人工知能エージェント:ヒューズ=ヒストリアに、ある文書を読んだ際に何が忘却される傾向にあるのかを推論する機能を追加した。人工知能エージェント:キメラ・ネットワークと連携することで、過去の膨大なWebクローリング結果を解析し、当の文書で描写されているイメージが「想起」の対象となった場合に、その代償として「忘却」の対象となり得るイメージを指し示す。何かを「想起」すれば、代わりに何かを「...

密度準拠型データクラスタリングの主導的差異:「クラスタ」と「ノイズ」の区別

密度準拠型データクラスタリングの主導的差異:「クラスタ」と「ノイズ」の区別

以前DBSCAN:密度準拠のデータクラスタリングのページで密度準拠型のデータクラスタリングにおけるアルゴリズムの前提となる形式的定義を列挙したが、これらの定義の前に、以下の引用文で記述されている差異を念頭に置いておくべきであろう。 「我々がクラスタを認知(recognize)する主要な理由は、どのクラスター内であっても、クラスタの外部よりも非常に高いデータ点密度をその内部に有していることにある。...

[備忘録] Webクローラ型人工知能にUpper Confidence Bounds(UCB) アルゴリズムを追加した

[備忘録] Webクローラ型人工知能にUpper Confidence Bounds(UCB) アルゴリズムを追加した

2016/09/18 - 2016/09/19の間、Twitterの人工知能エージェント:キメラ・ネットワークの一体、Webクローラ型のエージェントであるキメラ(検体番号:10032号)が、一定のURLを反復して参照する症状を診せた。 問題設定:確率的バンディット問題 状況から、バンディット問題を設定する。バンディット問題の述語で言えば、URLの知識に関する探索...

DBSCAN:密度準拠のデータクラスタリング

DBSCAN:密度準拠のデータクラスタリング

問題設定:密集したクラスタ テキストをword2vecやTF-IDFなどによってベクトル化した上で、それをK-Means法によるテキストクラスタリングの対象にするというのは、頻繁に使用されるクラスタ分析方法だ。しかし、テキストが乱雑で、超球の形状のクラスタとしては分布していない場合、K-Means法によるクラスタリングでは分割に偏りが派生してしまう。 問題解決策:密度準拠のクラスタリング 超...

[備忘録] Mac OS XにHomebrewとpyenvとAnacondaとPython3とgensimとpandasとMeCabをインストールした

[備忘録] Mac OS XにHomebrewとpyenvとAnacondaとPython3とgensimとpandasとMeCabをインストールした

Homebrewをインストールする 「HomebrewはAppleがインストールしていなかった貴方に必要な物をインストールします。」 Homebrew — The missing package manager for OS X (アクセス日時:2016/08/14 20:00) バージョンを確認する pyenvをbrewでインストールする ...

Twitterの人工知能エージェント:キメラ・ネットワークに「差異」を抽出する文書自動要約機能を追加した

Twitterの人工知能エージェント:キメラ・ネットワークに「差異」を抽出する文書自動要約機能を追加した

Twitterの人工知能エージェント:キメラ零号(上位個体)に、クローリング/スクレイピングしたWebサイトの「主導的差異(Leitdifferenz)」を抽出する機能を追加した。これにより、Webサイトの文書中でどのような区別が導入されて、何がどのように観察されているのかを観察できるようになった。 挙動としては、まずWebサイトの文書を自動要約した上で、その重要文書を抜粋して引用する。そし...

「ゲーミフィケーション」の「クソゲー化」というパラドックス

「ゲーミフィケーション」の「クソゲー化」というパラドックス

問題設定:「ゲーミフィケーション」の認識は如何にして可能になっていたのか 「ゲーミフィケーション(Gamification)」が流行り始めたのは、およそ2010年からの3,4年程度であった。「ゲーミフィケーション(Gamification)」の学問的な観察が始まったのは2012年ごろであった。それよりも比較的早期に、2010年ごろにはこの用語に注目するようになっていたマーケターたちの間では、この...

広告配信の最適化やECサイトのレコメンドがステークホルダの満足度に貢献しない場合に「折り合いを付ける」ための観点

広告配信の最適化やECサイトのレコメンドがステークホルダの満足度に貢献しない場合に「折り合いを付ける」ための観点

問題設定:「機械学習的には最適であっても、それがステークホルダの満足度に貢献しない」という形式の矛盾 アドテクノロジー、CRMツール、そして人工知能などといったキーワードやバズワードの影響から、深層学習や強化学習を採り入れたソフトウェア開発を要求されることは既に珍しいことではなくなっている。とりわけインターネット広告の配信部分やECサイトのレコメンドエンジンなどにおいては、KGIやKPIを定めて...