世界

顔認識の秘密の歴史

Woody Bledsoeは車椅子に座っていた彼のオープンガレージで、待っています。数ヶ月前に彼に会ったことのある人-地元のモルモン教会で日曜日に彼に挨拶したり、ジョギングで町の周りを見つけたりすることに慣れている人なら誰でも-74歳はほとんど認識できなかったでしょう。彼が人生の大部分で維持していた健康的な丸い頬は沈んでいた。変性疾患ALSは、話すことや歩く能力を奪い、携帯用ホワイトボードの短いメッセージをかき消すことがほとんどできなくなっていました。しかし、ウッディの心はまだ鋭かった。 1995年初頭、息子のランスがテキサス州オースティンの家に到着すると、ウッディはすぐにドライイレースインクで指示を出し始めました。

裏庭からゴミ箱を取り出してください。オスカー・ザ・グラウチが住んでいる古い金属の一種です。ランスがそれをつかみ、父親の近くに置きました。その後、ウッディは彼を試合と軽い液体のために家に送りました。ランスが戻ったとき、ウッディはガレージ内の2つの大きなファイルキャビネットに向かって動きました。

彼らはランスが覚えてからずっとそこにいました。 30代後半、ランスは子供の頃から彼らが開かれていないことを確信していた。そして彼は、それらが通常のファイルキャビネットではないことを知っていました。彼らは、彼が米国の原子力潜水艦のソナー装置で働いていたときに見たのと同じ種類で、耐火性で非常に重く、各引き出しに強力なコンビネーションロックがありました。彼の父親はゆっくりとホワイトボードに数字を書き始め、ランスの驚いたことに、この組み合わせはうまくいきました。 「最初の引き出しを開けたとき」、彼はほぼ25年後に「インディ・ジョーンズのように感じた」と私に言った。

古い、腐った文書の厚いスタックが中に横たわっていた。ランスはそれらを取り除き、父親の手に入れ始めました。ウッディは一度に2インチの紙の山を見渡してから、息子に火傷樽で始めた火の中に投げ入れました。ランスが気づいたものの中には、「分類済み」または「目のみ」とマークされたものもありました。両方のキャビネットが空になるまで炎は燃え続けました。ウッディは、灰が残るまでガレージに座ることを主張しました。

ランスは、彼が破壊を助けたものしか推測できませんでした。 30年近く、彼の父親はテキサス大学オースティン校の教授であり、自動推論と人工知能の分野の進歩に取り組んでいた。ランスは常に、彼が広い目の科学的楽観主義者であることを知っていました。1950年代後半まで、人間のすべての能力を備えたコンピューターの構築を夢見ていました。 、会話に参加し、ピンポンのまともなゲームをプレイします。

しかし、彼のキャリアの早い段階で、ウッディはマシンに特定の、比較的、歌われていないが、危険なほど強力な人間の能力:顔を認識する能力。ランスは、この分野での父親の仕事(顔認識技術に関する最も初期の研究)が、米国政府の最も秘密主義的な機関の関心を集めていることを知っていました。実際、ウッディの主な資金提供者は、CIAのフロント企業であったようです。ランスは、ワシントン州が大規模な自動化された規模で個人を特定する最初の努力の証拠を焼却したのでしょうか?

今日、顔認識は、携帯電話、ラップトップ、パスポート、および支払いアプリで選択されるセキュリティ機能になりました。ターゲット広告のビジネスに革命をもたらし、特定の病気の診断をスピードアップすることを約束します。 Instagramで友達にタグ付けするのが簡単になります。しかし、それはまた、ますます、国家の抑圧と企業の監視のツールです。中国では、政府は顔認識を使用して、少数民族であるウイグル人のメンバーを特定および追跡します。数十万人が「再教育キャンプ」に収容されています。米国では、Washington Post、Immigration and Customs Enforcement、およびFBIは、この技術をデジタルドラッグネットとして展開し、州の運転免許証データベースの何百万人もの顔の中から容疑者を検索しました。最初に裁判所命令を求めることなく。昨年、Financial Timesによる調査により、マイクロソフトとスタンフォード大学の研究者が集まって、公になったことが明らかになりました。被験者の知識や同意なしに共有された巨大な顔画像のデータセット。 (スタンフォード大学は、映像がキャプチャされた古いカフェの後、ブレインウォッシュと呼ばれていました。)両方のデータセットは削除されましたが、ハイテクスタートアップや中国の軍事アカデミーの研究者がそれらをマイニングする機会を持つ前ではありませんでした。

1960年代のWoodyの顔認識研究は、これらすべての技術的ブレークスルーとそれらの気まぐれな倫理的意味を予見しました。しかし、このテーマに関する彼の初期の基本的な仕事はほとんど完全に不明です。

幸いなことに、ウッディの意図が1995年のその日であったとしても、彼の研究と通信の大部分は、彼のガレージ。テキサス大学のブリスコーアメリカ歴史センターに、彼の論文の何千ページ、つまり39箱分の価値があります。これらの箱には、とりわけ、人間の被験者が何らかの幾何学的皮膚疾患に苦しんでいるかのように、数十人の顔の写真が含まれています。これらの肖像画では、今後数十年でより複雑になり、より強力になり、ユビキタスになっていくテクノロジーの起源の物語を識別することができます。

画像1965年の調査からのWoody Bledsoeの。コンピューターは、1945年と1965年の彼の2枚の写真が同じ人物を示していることを認識できませんでした。

写真:Dan Winters


Woodrow Wilson Bledsoe-常にウッディは彼が知っていたすべての人に-彼が仕事をする必要がなかった時間を思い出せませんでした。彼は1921年にオクラホマ州メイズビルの町で生まれ、幼少期のほとんどをシェアクロッパーである父親が家族を浮かばせるのを手伝っていました。全部で12人のブレッドソーの子供がいました。 10日ウッディは、トウモロコシの除草、木材の採取、綿の摘み取り、鶏の餌付けに長い日を費やしました。彼の母親、元学校の先生は、彼の知性を早くから認識していました。 1976年の未発表のエッセイで、ウッディは励ましのプレゼンスとして彼女を説明しました-たとえ彼女の励ましが時々桃の木の切り替えのビジネスの終わりから来たとしても。

ウッディは12彼の父親は亡くなり、大恐pressionの最中に家族をさらに貧困に陥れました。ウッディは、高校を卒業するまでの間、鶏の牧場で働きました。その後、彼はノーマン市に移り、オクラホマ大学の授業に出席し始めましたが、第二次世界大戦の前夜に陸軍に参加するために3か月後に辞めました。

数学の才能を示したウッディは、ミズーリ州のレナードウッド砦の給与オフィスを担当し、そこでは米軍兵士の波が次々と戦闘のために訓練されていました。 (「私たちのグループはすべての黒人部隊を処理した」とオクラホマンは書いた、「これは私にとって新しい経験だった。」)その後、1944年6月7日、Dデイの翌日、ウッディはついにヨーロッパに配備され、ビーチへの着陸用に作られた大型海軍艦艇をライン川に打ち上げる方法を考案したブロンズスター。

連合軍が勝利に向かって加速しているように、ヨーロッパの劇場に上陸したウッディは、戦争。 「これらは刺激的な時代でした」と彼は書いた。 「毎日は普通の生活の1か月に相当します。男性が戦争に夢中になる理由がわかります。彼は次の夏を解放されたパリで過ごし、彼の心と世界の経験は時折陶酔的な愛国心の雰囲気の中で乱暴に拡大しました。 「私が聞いた中で最もセンセーショナルなニュースは、私たちが原子爆弾を爆発させたことだ」とウッディは書いた。 「このような武器が敵ではなくアメリカ人の手にあることを嬉しく思いました。」

ウーディは、戦争が終わってから学校に戻るのを待ちきれませんでした。彼はユタ大学で数学を専攻し、2年半で修了し、その後博士号のためにバークレーに留学しました。卒業後、彼はニューメキシコのサンディア社に就職し、水素爆弾の発明者の一人であるスタニスワフ・ウラムなどの著名人と一緒に政府資金による核兵器研究に取り組みました。 1956年、ウッディはマーシャル諸島に飛んで、エネウェタク環礁での兵器実験を観察しました。今日まで、その一部はチェルノブイリまたは福島。 「自分の親愛なる国が世界で最も強いままでいるのを助けることができて、私は満足していました」と彼は書いた。

サンディアはまた、ウディに世界への最初の一歩を提供した。彼の残りのキャリアのために彼を消費するコンピューティング。最初は、コードを書く彼の努力は、核兵器研究の厳しい計算に直接結びついていました。初期の取り組みの1つである「大規模な熱核攻撃からのフォールアウトの確率を計算するプログラム」では、爆発降伏、破裂点、爆発時間、平均風速などを考慮して、フォールアウトがケースのどこに着地するかを予測しました。

しかし、コンピューティングとのロマンスが成長するにつれて、ウッディは自動パターン認識、特にマシンリーディング(ラベルのない画像を認識するようにコンピューターに教えるプロセス)に興味を持ちました。書かれた文字の。彼は友人であり同僚であり、数学の発明家、航空技術者、生物物理学者であるイベン・ブラウニングとチームを組み、n-タプルメソッド。彼らは、文字Qなどの印刷文字を、セルの長方形のグリッドに投影することから始めました。グラフ用紙。次に、各セルに文字の一部が含まれているかどうかに応じて2進数が割り当てられました。Emptyは0、Populatedは1を取得しました。次に、セルは座標セットのように、順序付けられたペアにランダムにグループ化されました。 (理論的には、グループ化には任意の数のセルを含めることができるため、n-tupleという名前になります。)さらに数回の数学的操作により、コンピューターはキャラクターのグリッドにユニークなスコアを割り当てることができました。コンピューターが新しいキャラクターに出会うと、そのキャラクターのグリッドをデータベース内の他のグリッドと単純に比較し、最も近い一致が見つかるまで

n-タプル方法は、同じ文字の多くのバリアントを認識できることでした:ほとんどQsは、他のQs。さらに良いことに、このプロセスはテキストだけでなく、あらゆるパターンで機能しました。 Woody’sの数学者で長年の友人であるRobert S. Boyerが共著したエッセイによると、n-tupleメソッドは、パターン認識の分野を定義するのに役立ちました。 「マシンに、人々がしているようなことをさせるにはどうすればいいのか」と尋ねる初期の取り組みの1つでした。

彼がを考案していた頃*)n-タプルの方法、ウッディは「コンピューター人」と呼ばれるマシンの構築についての最初の空想を抱きました。数年後、彼は「野生の興奮」を思い出すでしょう彼は、人工意識のためのスキルのリストを思いついたように感じました:

」私は眼鏡に収まる小さなカメラで、またはその一部を、私の耳にささやくように耳栓を付けて見ることができました。路上で彼らに会った…あなたが見るように、私のコンピューターの友人は顔を認識する能力を持っていた。」


1960年、ウッディはブラウニングとサンディアの3人目の同僚が自分の会社を設立しました。 Panoramic Research Incorporatedは、最初はカリフォルニア州パロアルトの小さなオフィスにあり、まだシリコンバレーとして知られていませんでした。当時、世界のほとんどのコンピューター(パンチカードや磁気テープにデータを保存する大容量マシン)は、大企業のオフィスや政府の研究所に置かれていました。 Panoramicは独自のものを購入する余裕がなかったため、近所の人たちからコンピューティング時間をリースしましたが、夜遅くに安くなったことがありました。

Panoramicのビジネス、ウッディ後に同僚にそれを説明し、「私たちが「世界を動かす」ことを望んでいたアイデアを試してみた。」Nels Winklessによると、いくつかのパノラマプロジェクトで協力し、後にPersonal Computingマガジン、「彼らの機能は、文字通り、他の人が愚かすぎると感じることをすることでした。」

同社は奇妙で折lect的な研究者を集めました。その多くは、ウッディのように、大恐duringの際に何も成長せず、今ではすべてを探求したいと考えていました。それらの傾向は華麗なものから野生のものまでに及びました。貧しい農家の家族から来て、キャベツ以外はほとんど何も食べていなかった青春の2年間を過ごしたブラウニングは、永久にいじくり回していました。ある時点で、彼は別のパノラマ研究者であるラリー・ベリンジャーと協力して、犬用のトラックと呼ばれる犬用トラックのコンセプトを開発しました。彼らはまた、光のレベルを音に変換する視覚障害者向けのペン型デバイスであるHear-a-Liteと呼ばれるものを構築しました。

翼として働いていたベリンジャー10代の歩行者(自転車の怪我としての悪いパラシュート着陸からの打撲傷をプレーすることで母親から娯楽を秘密にした)、また、トムで有名になった防音壁を破るロケット飛行機の設計を助けましたWolfe’sThe Right Stuff。後に彼は「完全にランダムで無人の方法で草を刈るための自走式芝刈り機」であるMowbotを作成しました(ジョニーカーソンはThe Tonight Show。)

その後、ロボットプログラミングのパイオニアであるHelen Chan Wolfがいました。カレッジ。彼女は、電気電子技術者協会によって「人工知能を具体化した世界初のロボット」と評されている、ロボットシェーキーのプログラムを支援しました。かつての同僚から「ロボット工学のレディ・エイダ・ラブレース」と呼ばれました。1960年代初頭、ウルフのコーディング作業に1フィート半のパンチカードのスタックが含まれる場合、彼女はさまざまなアイデアにa敬の念を抱きました。パノラマの同僚が壁に投げました。ある時点で、ウディは「DNAを解明することを望み、当時持っていたコンピューターでそれを行うには30〜37年かかるだろう」と判断したとウッディは言いました。私は言った、「まあ、私たちはそれをしないだろうと思う。」」

恐らく驚くことではないが、Panoramaは適切な商業資金を見つけるのに苦労した。 Woodyは、Equitable Life Assurance SocietyやMcCall’sなどのビジネスクライアントにキャラクター認識技術を売り込むために最善を尽くしました。雑誌、しかし契約を上陸させることはありません。 1963年までに、ウッディは会社が倒れることをほぼ確信していました。

しかし、その存続期間中、Panoramaは少なくとも1人の信頼できるパトロンを持っていました。代理店。 CIAについての直接の言及がWoodyの論文に存在した場合、彼は私道で灰になった可能性があります。しかし、ウッディのアーカイブに残った証拠の断片は、長年、パノラマがCIAのフロント企業と取引を行っていたことを強く示唆しています。パノラマスタッフ全員と友好的であり、ブラウニングの生涯の友人であったウィンクレスは、少なくとも部分的には、代理店の資金調達を念頭に置いて会社が設立されたと考えています。 「これほど多くの言葉で私に話した人は誰もいなかった」と彼は回想するが、「そうだった。」

今日サインアップ

申し込みますLongreadsニュースレターからの最高の機能、アイデア、調査WIRED。

秘密の情報の自由を専門とするWebサイトであるBlack Vaultが取得した記録によるとパノラマは、CIAの悪名高い「マインドコントロール」プログラムであるProject MK-Ultraに取り組んでいる80の組織の1つであり、頻繁に嫌がる人間の被験者に課される心理的拷問で最も有名です。メディカルサイエンスリサーチファンデーションと呼ばれるフロントを通じて、パノラマは細菌および真菌毒素の研究と「選択された動物種の活動の遠隔方向制御」に関するサブプロジェクト93および94に割り当てられたようです。セントマーチン大学の人類学者であるプライスは、ウッディと彼の同僚が、人間の生態調査協会から資金を受け取ったことを示しています。作業。 (CIAはWoodyまたはPanoramicの知識や接続を確認も拒否もしません。)

しかし、それはKing-Hurley Research Groupと呼ばれる別のフロント企業でした。 、PanoramaでWoodyの最も注目に値する研究をバンクロールしました。 1970年代に提起された一連の訴訟によると、キングハーレーは、CIAがエアアメリカとして知られている機関の秘密の空軍のために飛行機とヘリコプターを購入するために使用したシェル会社でした。しばらくの間、キングハーレーはスタンフォード大学で精神薬理学研究にも資金を提供しました。しかし1963年初頭、ウッディブレッドソーとは異なる種類のピッチの受信者でした。彼は「単純化された顔認識マシンの実現可能性を判断する研究」を行うことを提案しました。 n-タプル方法、彼はコンピューターに10人の顔を認識するように教えようとしました。つまり、さまざまな人の10枚の写真のデータベースをコンピューターに提供し、それぞれの新しい写真を認識できるかどうかを確認したかったのです。 「すぐに人の数を数千人に増やしたいと思うだろう」とウッディは書いた。 1か月以内に、キングハーレーは彼にゴーサインを与えました。

あるアプローチでは、Woody Bledsoeは顔を特徴に分割し、距離を比較するようにコンピューターに教えましたそれらの間の。

写真:Dan Winters


十facesは今ではかなりの目標のように見えるかもしれませんが、1963年には息をのむほど野心的でした。書かれた文字の認識から顔の認識への飛躍は大きなものでした。そもそも、写真をデジタル化するための標準的な方法も、描画するデジタル画像の既存のデータベースもありませんでした。今日の研究者は、無料で入手できる数百万のセルフィーでアルゴリズムをトレーニングできますが、パノラマは写真ごとにデータベースをゼロから構築する必要があります。

さらに大きな問題がありました。ページ上の2次元の文字とは異なり、生きている人間の3次元の顔は静的ではありません。同じ人物の画像は、頭の回転、照明の強さ、角度が異なる場合があります。人々の年齢と髪型が変わる; 1枚の写真で気楽に見える人は、次の写真で心配そうに見えるかもしれません。途方もなく複雑な分数のセットで共通の分母を見つけるように、チームはこの変動性を何らかの形で修正し、比較する画像を正規化する必要があります。そして、自由に使えるコンピューターが仕事に任せられているという確信はほとんどありませんでした。メインマシンの1つは、192 KBのRAMを搭載したCDC 1604でした。これは、基本的な現代のスマートフォンの約21,000倍の作業メモリです。

これらの課題を最初から十分に認識、ウッディは分割統治アプローチを採用し、研究を細分化し、異なるパノラマ研究者に割り当てました。 1人の若い研究者がデジタル化の問題に取り組みました。彼は、16 mmのフィルムストックにプロジェクトの人間の被写体の白黒写真を撮りました。その後、彼はBrowningが開発したスキャンデバイスを使用して、各画像を数万のデータポイントに変換しました。各データポイントは、0(完全に暗い)から3(完全に明るい)の範囲の特定の場所での光度の値を表します画像。ただし、コンピューターが一度に処理するにはデータポイントが多すぎるため、若い研究者はNUBLOBというプログラムを作成し、ランダムなサイズのスウォッチに画像を切り取り、n-それぞれのタプルのようなスコア。

その間、ウッディ、ヘレン・チャン・ウルフ、学生は頭の傾きを説明する方法を勉強し始めました。まず、額の頂点からあごまで、被験者の顔の左側の皮膚に一連の小さな十字を描きました。次に、2つのポートレートをスナップしました。1つは被写体が正面を向き、もう1つは彼が45度向きを変えたものです。これら2つの画像のすべての小さな十字がどこに着いたかを分析することで、15度または30度回転したときに同じ顔がどのように見えるかを推定できました。最終的には、マークアップされた顔の白黒画像をコンピューターに送り込むと、不気味で、点描的で、非常に正確な自動回転したポートレートがポップアウトされます。

これらのソリューションは独創的でしたが、不十分でした。作業が開始されてから13か月後、パノラマチームはコンピューターに単一の人間の顔を認識させることを教えていませんでした。ウッディは、1964年3月にキング・ハーリーに提出した進捗報告書で、髪の成長、顔の表情、老化という3つの脅威が「非常に大きな変動性の原因」であることを示しました。彼は、このタスクは「現在のパターン認識とコンピューター技術の現状を超えている」と述べたが、顔認識に取り組むための「完全に新しいアプローチ」を試みるために、より多くの研究に資金を提供することを勧めた。

翌年、ウッディは、自動化された顔認識への最も有望な道は、顔をその主要なランドマーク間の関係のセットに減らすものであると信じるようになりました:目、耳、鼻、眉毛、唇。彼が想像したシステムは、現代のマグショットを発明したフランスの犯罪学者であるアルフォンス・ベルティヨンが1879年に開拓したシステムに似ていました。ベルティヨンは、左足の長さや肘を中指の端まで。アイデアは、十分な測定を行った場合、すべての人がユニークであるということでした。このシステムは労働集約型でしたが、機能しました:1897年、フィンガープリンティングが普及する何年も前に、フランスのジェンダームはシリアルキラーJoseph Vacherを識別するためにそれを使用しました。

1965年、Panoramaは完全に自動化されたBertillonシステムを作成しようとしました。顔。チームは写真の明るさと暗さのパターンを解析することで、鼻や唇などを見つけることができるプログラムを考案しようとしましたが、その努力はほとんど失敗でした。

だから、ウッディとウルフは、顔認識への「マンマシン」アプローチと呼ばれるものの探索を始めました。これは、方程式に少し人間の援助を組み込む方法です。 (CIA研究開発局の最近機密解除された歴史は1965年にまさにそのようなプロジェクトに言及しています。その同じ年、ウッディは顔認識に関する手紙を部門の分析責任者であるジョンWカイパーズに送りました。)グレゴリーと彼の友人の1人が写真の山(全部で122人、約50人を表す)を通り、上から下まで耳の長さ、隅から下まで口の幅など、各顔を22回測定しますコーナー。その後、ウルフは数字を処理するプログラムを作成しました。

実験の終わりに、コンピューターはすべての測定値を正しい写真と一致させることができました。結果は控えめでしたが否定できません:ウルフとウッディは、バーティヨンシステムが理論的に機能することを証明しました。

次の動きは、1965年の終わり近くに、より大きなステージを作ることでしたほぼ同じ実験の縮尺版。今回は、最近開発されたテクノロジーを使用して、マンマシンシステムの「人間」をはるかに効率的にしています。 King-Hurleyのお金で、彼らはRANDタブレットと呼ばれるものを使用しました。これは18,000ドルのデバイスで、フラットベッドイメージスキャナーのように見えますが、iPadのような働きをしました。スタイラスを使用して、研究者はタブレットに描画し、比較的高解像度のコンピューター読み取り可能な画像を作成できました。

ウーディと彼の同僚は、一部の学部生に新しいRANDタブレットに各写真を置き、スタイラスで主要な機能を特定します。このプロセスは依然として困難でしたが、以前よりもはるかに高速でした:学生は、各顔の少なくとも2つを含む約2,000の画像のデータを1時間あたり約40の速度で入力することができました。

この大きなサンプルサイズでも、ウッディのチームは通常の障害をすべて克服するのに苦労しました。たとえば、コンピューターはまだ笑顔に問題があり、「顔を歪め、界面の測定値を大幅に変更します」。ウッディ自身の顔が証明したように、加齢も問題のままでした。 1945年のWoodyの写真と1965年の写真をクロスマッチングするように求められたとき、コンピューターは混乱していました。歯を見せる笑顔と暗い未亡人のピークを持つ若い男性と、厳しい表情と髪の毛の薄さを持つ古い男性とはほとんど似ていませんでした。それはあたかも数十年で別の人を生み出したかのようでした。

そしてある意味で、彼らはそうでした。この時点までに、ウッディはパノラマの新しい契約に苦労し、「仕事が多すぎるか足りないというばかげた立場にいる」ことにうんざりしていた。彼は常に新しいアイデアを資金提供者に売り込んでいた。倫理的に疑わしいと見なされるようになりました。 1965年3月-中国が新patternウイグル自治区の民族的ウイグル族を特定するために顔のパターンマッチングを使用する50年前に、ウーディはArpaとして知られる国防総省高等研究計画局に、実行可能性を調査するためにパノラマ顔の特徴を使用して人の人種的背景を判断する方法。 「さまざまな人種的および環境的背景から世界中の人々に対して行われた非常に多くの人類学的測定が存在する」と彼は書いた。 「長年にわたってかなりの費用と労力で収集されたこの広範で貴重なデータの保管は、適切に活用されていませんでした。」Arpaがプロジェクトへの資金提供に同意したかどうかは不明です。

明らかなのは、ウッディが数千を投資していたことですPanoramicで自分のお金の1ドルを取り戻す保証はありません。一方、テキサス大学オースティン校の彼の友人は、安定した給料の約束をぶら下げて、彼にそこで働くように勧めていました。ウッディは1966年1月にパノラマを去りました。会社はすぐに倒れたようです。

コンピュータの人を頭の中で遊ぶという夢を抱いて、ウッディは家族をオースティンに引っ越しました。自動推論の研究と教育に専念すること。しかし、顔認識の彼の仕事は終わっていません。その頂点はすぐそこにありました。


1967年、オースティンに移ってから1年以上経ったウッディは、人間の顔のパターンを認識する最後の課題。この実験の目的は、法執行機関がマグショットとポートレートのデータベースを迅速に選別し、マッチを探すのを支援することでした。

以前のように、プロジェクトの資金は米国政府から来ています。 2005年にCIAによって機密解除された1967年の文書は、検索時間を100分の1に短縮する顔認識システムの「外部契約」に言及しています。今回、記録によると、お金は仲介者として行動している個人を通じてもたらされた。

プロジェクトに関するウーディの主な協力者は、スタンフォード研究所の応用物理学研究所の研究エンジニアであるピーター・ハートでした。 (現在、SRI Internationalとして知られるこの研究所は、キャンパスで軍事資金に大きく依存しているため、1970年にスタンフォード大学から分裂しました。)ウッディとハートは、約800枚の画像のデータベースから始まりました。年齢と頭の回転が異なる「400人の成人男性白人」。 (ウッディの顔認識研究では、女性や色の人の画像、またはそれらへの言及は見ませんでした。)RANDタブレットを使用して、写真ごとに46の座標を記録しました。 、各眉に4つ。画像のバリエーションを正規化するウッディの以前の経験に基づいて、彼らは数学を使用しました 各ヘッドを前方に見える位置に回転させるための重要な方程式。次に、スケールの違いを説明するために、各画像を標準サイズに拡大または縮小し、瞳孔間の距離をアンカー指標として使用しました。

コンピューターのタスクは各顔の1つのバージョンを記憶し、それを使用して他の顔を識別します。ウッディとハートは、マシンに2つのショートカットの1つを提供しました。グループマッチングと呼ばれる最初の方法では、コンピューターは顔を特徴(左眉、右耳など)に分割し、それらの間の相対的な距離を比較します。 2番目のアプローチは、ベイジアン決定理論に依存していました。 22の測定値を使用して、全体についての経験に基づいた推測を行いました。

最終的に、2つのプログラムはタスクをほぼ同様に処理しました。さらに重要なことは、彼らは人間の競争相手を水から吹き飛ばした。 WoodyとHartが3人に100の顔のサブセットをクロスマッチするように依頼したとき、最速の顔でさえ6時間で終了しました。 CDC 3800コンピューターは同様のタスクを約3分で完了し、時間を100分の1に短縮しました。ウッディとハートは、人間は頭の回転と写真の質の低下にうまく対処していると認めたが、コンピューターは加齢による違いを容認するのに「非常に優れていた」。全体的に、彼らは、機械が人間を「支配」または「ほぼ支配」していると結論付けました。

これは、ウッディが顔認識研究で得た最大の成功でした。また、この件について彼が書く最後の論文でもありました。この論文は、「政府の理由」でハートが言うように、決して公開されませんでした。ハートとのコラボレーションが終了してから2年後の1970年、マイケル・カスラーというロボット工学者は、ベル研究所のレオン・ハーモンが計画していた顔認識研究についてウッディに警告した。 「この2番目のレートの研究が公開され、利用可能な最高のマンマシンシステムであると思われます」とウッディは答えました。 「レオンは、一生懸命働くと、1975年までにほぼ10年遅れると思われます。」ハーモンの研究がScientificの表紙を作ったとき、彼はイライラしていたに違いありません。数年後、アメリカ人、彼自身の、より高度な作品は基本的に金庫室に保管されていました。


その後の数十年、ウッディは自動推論への貢献に対して賞を受賞し、人工知能の進歩協会の会長を1年間務めました。しかし、彼の顔認識の仕事はほとんど認識されずに忘れられてしまいますが、他の人はマントルを拾いました。

1973年、日本のコンピューター科学者であるカナデタケオは、顔認識技術の飛躍。当時、非常に珍しい商品だったものを使用して-850のデジタル化された写真のデータベースで、主に1970年日本の吹田で開催された世界博覧会で撮影された-カナデは、マンマシンシステムから男性を排除するというウッディの夢をついに実現しました。

ウーディは、長年にわたって1、2回、顔認識の専門知識を磨きました。 1982年に、彼はカリフォルニアの刑事事件の専門家証人として雇われました。メキシコのマフィアの容疑者は、コントラコスタ郡で一連の強盗を犯したとして告発されました。検察官は、ひげ、サングラス、冬の帽子、長い巻き毛を持つ男性の監視映像など、いくつかの証拠を持ちました。しかし、被告人のマグショットは、短い髪のきれいなひげを生やした男を示した。ウッディはパノラマ調査に戻って銀行強盗の顔を測定し、被告人の写真と比較しました。弁護人の喜びの多くに、ウッディは、鼻の幅が異なるため、顔が2人の人である可能性が高いことを発見しました。 「ちょうど合わなかった」と彼は言った。男はまだ刑務所に入れられたが、ウッディの証言に関連する4つのカウントで無罪となった。

過去10年ほどで顔認識が始まった有能になる ミシガン州立大学のコンピューター科学者であり、顔認識ハンドブックの共同編集者であるAnil K. 。実際、ウッディが遭遇したほぼすべての障害は解消されました。一つには、デジタル化された画像の無尽蔵な供給があります。 「ソーシャルメディアをクロールして、好きなだけ顔を取得できます」とJain氏は言います。また、機械学習、ストレージ容量、処理能力の進歩により、コンピューターは効果的に自己学習します。いくつかの基本的なルールが与えられると、データの連と連を解析し、人間の顔からチップの袋まで、事実上すべてをパターンマッチする方法を見つけ出すことができます。RANDタブレットやバーティヨンの測定は不要です。

1960年代半ばから顔の認識がどこまで進んだかを考えても、ウッディはこの分野が解決しようとしている問題の多くを定義しました。たとえば、顔の位置のばらつきを正規化する彼のプロセスは、写真の一部です。顔認識をより正確にするために、今日のディープネットワークは、顔のランドマークを使用して新しい位置を推定し、顔を前方姿勢に再調整することがよくあります。そして、今日の深層学習ベースのシステムは、人間のプログラマーによって鼻と眉を明確に識別するように指示されていませんが、1965年のウッディのその方向への転換は、何十年にもわたって分野の方向を定めました。 「最初の40年間は、この機能ベースの方法に支配されていました」とカーネギーメロンのロボティクス研究所の教授であるカナデは言います。ある意味で、フィールドは、Woodyがnのバリエーションを使用したときに、人間の顔をゆるめようとする初期の試みのようなものに戻りました。 -データポイントの巨大なフィールドで類似性のパターンを見つけるタプルメソッド。顔認識システムが複雑になったように、彼らは実際に画像のペアの類似性スコアを作成し、それらがどのように比較されるかを見ているだけです。

しかし、おそらく最も重要なことには、ウッディの研究は、永続的で問題のある顔認識。終末論的な能力が数年後に初めて明らかになった他の世界を変えるテクノロジーとは異なり(ソーシャルメディア、YouTube、クアッドコプタードローンを参照)、顔認識テクノロジーの潜在的な悪用は、Panoramaの誕生からほとんど明らかでした。ウッディの時代の遺物であるとみなす偏見の多くは、サンプルセットがほぼ完全に白人男性に傾いていることです。政府機関に対する一見明るい信頼。顔認識を使用して人種を区別する誘惑-今日もテクノロジーを使い続けています。

昨年、AmazonのRekognitionソフトウェアのテストでは、28人のNFLプレイヤーを犯罪者と誤認しました。数日後、ACLUは米国司法省、FBI、およびDEAを訴え、Amazon、Microsoft、およびその他の企業が作成した顔認識技術の使用に関する情報を入手しました。顔認証ソフトウェアの50人以上の開発者からのコードをテストした米国国立標準技術研究所の2019年のレポートでは、白​​人男性は他のグループよりもマグショットと誤って一致する頻度が低いことがわかりました。 2018年に、2人の学者がこの分野に対してブロードサイドを書きました。「顔認識技術は、これまでに発明された中で最もユニークな危険な監視メカニズムであると信じています。」

1993年、ALSからの神経変性がウッディのスピーチを不明瞭にしました。彼の死後に書かれた長いトリビュートによれば、彼は彼のスピーチが理解できなくなるまでUTで教え続け、彼はもはやペンを持てなくなるまで自動推論の研究を続けました。 「常に科学者」と著者は書いています、「ウーディは病気の進行を記録できるように彼のスピーチのテープを作成しました。」彼は1995年10月4日に亡くなりました。 Austin American-Statesmanは、顔認識に関する彼の研究については何も言及していません。それと一緒に走った写真では、白髪のウッディがカメラを見つめ、大きな笑顔が顔全体に広がっていました。


Shaun Raviv(@ ShaunRaviv)アトランタに住んでいる作家です。彼は

    神経科学者Karl Fristonについて26.12号で書いています。

この記事は2月号に掲載されています。 今すぐ登録

この記事についてご意見をお聞かせください。 mail@wired.comでエディターに手紙を提出してください。


その他の素晴らしいWIREDストーリー

Related Articles

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

Close