飛ん で いく 顔 文字

こんにちは、ヨシケンです! 前回までの記事 では、風景や食べ物などを識別して、それをしゃべってくれるカメラになりました。 今回は、更にdocomo APIで識別できるものを増やして、顔や文字なども読み取れるようにします。 また、画像解析でよくある検出部分を赤枠で囲む処理をして、その写真を自動でメールなどに送る機能も付けます。 1. 物体検出APIを使って、写真の顔、お札を囲んでみる 既にカテゴリ認識として、食べ物、風景やファッションなどを検知できていると思いますが、それに追加して、顔やお札などを抜き出せる物体検出APIも付け加えます。 このAPIを使用できるよう Docomo Developer Support ページから、機能を追加しておいて下さい。 この物体検出では、体の部位や日本の通貨を特定する事ができます。 また検出したものの画像中の位置も取れるので、どこに何が写っているかも写真中にマップする事もできます。 これまでのプログラムに、物体APIのURLと、体を特定するbodyPart、お札のcurrencyというmodelを追加します。 "url": " "model": "['currency', 'bodyPart']" また、この物体検出APIでは、検出した物の画像中の位置も補足できるので、その座標も取得します。 x = int(can['xMin']) y = int(can['yMin']) x2= int(can['xMax']) y2= int(can['yMax']) そしてctangle()、cv2. 【AviUtl】さつき氏のスクリプトまとめ(1/6)【@TA効果一覧】 | AviUtlの易しい使い方. putText()という関数を使って、検出物体の四角形の囲いと文字を写真に追加します。 ctangle(img, (x, y), (x2, y2), (0, 0, 255), thickness=2) cv2. putText(img, ('utf-8'), (10, 20), _AA, 0. 6, (255, 0, 0), 1, _AA) このプログラムによって、写真の中の顔を抽出した部分を枠で囲み、face(92. 1%)のような検出率を入れる事ができるようになります。 全体のプログラムは一番最後にまとめて付けています。 引き続き、文字認識APIの方も見ていきます。 2. 文字認識APIを使って、文字を読み取る 更に追加で、画像中に文字がある場合に、それを抜き出す文字認識APIを使っていきます。 文字認識APIのURL、モデル名は以下のようなものです。 "model": "['word']" 文字認識に関しては、まず情景画像要求 getImage(fname, modelName, lang) を行い、そこで得られたidを次の結果取得 getWordList(img_id) に渡して、文字を取り出します。 先程と同様に、文字認識部分の位置もx, yで返してくれるので、それを取得します。 x = int(can['shape']['point'][0]['@x']) y = int(can['shape']['point'][0]['@y']) x2= int(can['shape']['point'][2]['@x']) y2= int(can['shape']['point'][2]['@y']) そうすると、Device Plusの記事を読み取ったのですが、このように文字の部分を抜き出してくれます。 いくつか、不思議な文字を読み取ってしまっていますが、「電子工作」や「読み上げ」「おしゃべり」など正確に検出してくれています。 3.

【Aviutl】さつき氏のスクリプトまとめ(1/6)【@Ta効果一覧】 | Aviutlの易しい使い方

【After Effects】複数の写真が並んでいく3Dスライドショーの作り方【subtitles】 - YouTube

バースデーライブ「宮本浩次縦横無尽」 2021. 6.

June 1, 2024, 1:17 pm