読者です 読者をやめる 読者になる 読者になる

toricago

Toricago Lifehack Research

そろそろ本腰入れとく!?音声認識によるランニング仕事術

運動、食事、健康、心

はじめに

 今年の上旬に野口悠紀雄さんの『話すだけで書ける究極の文章法 人工知能が助けてくれる!』(以後、「野口本」)や、慎泰俊さんの『ランニング思考──本州縦断マラソン1648kmを走って学んだこと』を読んで、「ランニング中にも仕事をする」という人がいることを知り衝撃を受けた。
 野口さんは、驚異的な量の連載記事や書籍執筆で有名だが、最近は毎朝のジョギングの時間が最も執筆活動が進む時間帯、ということを明かしている。本来はジョギングというのは息抜きにやるもの、という概念が私にはあったが、野口さんにとっては一日で最も気合いを入れる時間帯だそうだ。
 2冊目は本州縦断ランニングの日記のようなエッセーのような本であり、私も良くランニングをするので、ランナーとしてすごく面白かったのだが、「起業家として超絶忙しい中、1648kmをどのようにして走りきったのか?」というコツが数々紹介されていて別の意味でも面白かった。例えば会社の会議やお客様との電話などをランニング中に行うという、常識破りな発想が紹介されている。私はランニング中に仕事をするなんて発想はまったくなかったので、自分の思考の範囲をストレッチさせる意味で非常に勉強になった。
 最近は雑誌やネット上の記事でも音声認識仕事術の特集などをよく見かけるようになった。私自身はブログを書くのにそれなりの時間が取られていて、色々な工夫を取り入れているものの、それほど執筆時間が短縮されずにモヤモヤを感じてきた。もし音声認識によって、通勤中にベラベラと話しながら会社に行ったら、着いたら記事が完成していた、なんてことになれば夢のようだなぁ、と想像が膨らむ。ということで、そんな夢のようなことができるのか?数ヶ月に渡って少しずつ検証してきた。
 結論から言うと、そんな夢のようなことは起こらなかった(笑)。が、数百字単位のアイディアをどんどん出す、アイディアが消える前に形に残しておく、ランニング中の時間を有効活用できるようになる、などの利点があった。そこで今回の記事では、音声認識メモのコツなどをまとめておきたい。

<今回の目次>

そもそも、どうやって音声認識をやるのか?

 PCでもできるし、スマホでもできる。例えばMacであれば「fn」キーを2回連打すれば音声入力モードになる。iPhoneであれば、キーボードが起動した時に左下に位置しているマイクボタンを押すだけだ。
 PCであればメールやブログを書いている時などのようにtypeする局面ではほぼすべて使えるし、スマホであればGoogle Documentやメモ帳などのアプリで使うと便利だ。より詳しく知りたい人は、少しぐぐってみると色々と出てくるので調べてみると良い。野口本にも丁寧に解説されている。ここではマイクとアプリだけ少し補足しておきたい。

マイクは?

 マイクはPCやスマホに内蔵されているものでも良いが、外出中に使う場合は常にPCやスマホを口元にもってこないといけないので、外付けマイクを別途利用することがお勧め。私はiPhoneを購入した時についてきたイヤフォン・マイク一体型のものを利用しているが、特に問題はなさそう。将来的にはマイクが常に口元にあるようなヘッドセットのものも使ってみたいと思っている。(ヘッドセットで音声認識をしている人がいればぜひ感想を教えてください!)

アプリは?

 基本的にはGoogleDocumentを用いて練習している。野口本でもそれがお勧めされている。ただし途中で音声入力モードが終了してしまうので、1分ぐらいしか継続して音声メモをとれない。そのため、常に音声入力モードが終了しているのかどうかを意識しておかないといけないので面倒。スマホ画面をずっと見ていないといけないので、ランニング中に音声認識を行う場合はこれが面倒になる。お勧めは背後でMusicアプリを起動しておき、音楽を流しておくこと。そうすると音声入力がOnのときは音楽が停止し、Offに切り替わると音楽が流れ出すので、「あ、オフになった」と画面を注視していなくても気づくことができる。
 それが嫌な人は「音声認識Mail」という有料アプリ(120円)が良い。コレは野口本でも紹介されていて使ってみた。例えば10分以上一方的に話し続けてもOK。ただし独自の認識エンジンを利用しているせいか、認識精度は低いので、帰宅後の修正作業の時間が増えやすい。(帰宅後の修正プロセスについては後述する。)

音声メモを取るシチュエーション

  PCが目の前にあって、デスクに座っているのであれば音声認識を使う利点は少ない。練習の意味しかない。特にPC単語登録を200個以上、行っているのであればタイピングのほうが断然速い。

 一方で、PCを使えない局面やスマホフリック入力しないといけないときは、よく指摘されていることだが、音声認識が非常に便利。例えば、トイレ中、料理中、横になりたい時、通勤中、散歩中やランニング中だ。
 トイレの時間はKindleアプリを開いて本を読み始めるには短すぎるし、Feedlyアプリを開いてネット記事をじっくり読むのにも短い。しかし音声認識であれば、ちょうど頭の中に渦巻いている言葉を一旦吐き出すことができる。ただしこれは練習中なので、将来的に続けていくかは未知数。これは自宅の場合であって、外出中の個室で音声メモを取って変人扱いされないよう注意したい。
 横になりながらの音声メモも良い。例えば、一日仕事をして疲れて帰宅して、デスクに座ってひと仕事するのは強力な精神力が求められる。しかしベッドで横になって、ベラベラとアイディアをアプリに吹き込むのは気軽にできる。しかも、そうやってベラベラと話しているとだんだん戦闘モードになってきて、「寝る前にもう少し頑張るか?」という気持ちにもなり、仕事、資格試験、趣味やブログ記事執筆などのタスクが片付きやすくなる。野口本にも似たような例が出てくるし、強くお勧めできるシチュエーションだ。

家の中と外出中の違いは大きい

 家の中だとWifiに繋がっているし、雑音もなく快適。外出中に電波が悪い場所だとほとんど認識されないので、かなりストレスがたまる。そのため、ある程度の回数、練習を繰り返し、「音声認識をやってはいけないところ」を把握しておく事が必要。外出中によく電話をするビジネスパーソンは、電話中に電波が悪くなる場所がそのまま音声メモに向いていない場所と思えば良い。しかし、場所さえ掴めれば気にならない。満員電車の中で、人が比較的少ない車両を一旦見つければ、通勤時間が少し快適になるのと同じだ。

ランニング中の音声認識について

 前述のように、野口さんは一日の中で最も生産性の高い時間が朝の1時間のジョギング中ということを明かしている。「え?運動している時間が?」と最初は思ったが、運動中にずっと音声メモを作り続けているらしい。これが様々な連載記事や大量執筆している書籍の原稿の土台となっていくようである。私も週に何度かランニングを行っているので、これはぜひ真似をしてみたいと思ってしばらく挑戦しているので、ここでは私が感じたランニングのコツを幾つか紹介しておきたい。

電波の良いところだけで実施すること

 先程の繰り返しになるが、電波の良いところだけで音声メモを作成すること。こうしないとストレスが貯まるし時間が結構無駄になる。3〜4回同じところを走っていると、だんだん電波の悪い箇所がわかってくるので、電波が悪いところを走るときは音楽を聞いたり、英語アプリで語学の勉強をしたりすると良い。

ずっと話し続けることは難しい

 音声メモを作成していると、「あれ?何を話せば良いんだろう?」という状態に簡単に陥る。私は紙のメモ書きを好んで行っており、毎年1万枚以上のメモを書いているが、手書きだと思考を発散させても徐々に収束していく気持ちよさがあるし、徐々に生産的な内容を生み出していくこともできる。

 しかし、音声メモだとそれなりの集中力を割かないと生産的なメモは生まれない。同じことを何度も話してしまうこともあるし、内容の質が手書きのメモ書きとくらべて若干落ちる気がしている。そのような低レイヤーの思考が続いてしまわないように、意識的に「今はこのテーマに考えよう」と意気込む必要がある。
 それに、テーマが決まっても10分以上話し続けることは非常に難しい。自分の脳にいかに内容がないかがわかるので傷つく面もあるが、「まぁ、最初はこんなもんか」と思うようにしている。野口さんは一時間ずっと吹き込み続けるらしいが、それは超人レベルということもわかった。恐らく私含め凡人が挑戦する場合は、「10分音声→20分音楽→10分音声」のようなサイクルが良いと思う。

クールダウンと音声認識は相性が良い

 クールダウンのときは音声認識が加速する。頭に酸素が行き渡っているし、負荷のかかる運動により嫌なことも忘れてスッキリしているので、非常に頭が働く。この手を使わない手はない。ランニング中のメモは、走ることに精一杯になってしまっている場合もありスムーズに取れないこともあるのだが、クールダウン中の歩いているときは音声認識に没入しやすくなる。ランニング中にあまり音声認識が進まなくても、クールダウンがあるので落ち込まず挑戦してみてほしい。(もしくはランニング中のペースを下げることも一つの戦略であろう。)

人の目線もそれなりに気になる

  道路沿いの歩行者通路を音声認識をしながら走っていると、他の人の目線が気になってしまって、音声メモに集中できなくなる。だが、公園の中だと、なぜか皆優しい。誰もいちいちこちらをジロジロ見たりしない。緑の自然の効果なのだろうか?なので公園ランニングは音声メモに向いていると思っている。

音声メモのアフターケア

 音声メモのとりっぱなしは非常に危険。その日のうちに推敲する必要がある。なぜなら、上手く認識できた時は問題ないが、電波の悪いところで話した内容や、Google/Apple以外のエンジンを用いたアプリを利用した場合は、その日のうちに修正しておかないと再現不可能になる。ここは少々面倒であるが、自分の音声メモのスキル向上や、Google/Apple側の認識エンジンの驚異的スピードでの改善により、多くて数年の我慢であると思っている。
 また、ファイル管理もそこそこ面倒である。一つのファイルに毎日付け足していると、間違ってランニング中に全部消してしまったりすることもある。現状は一日1ファイルに落ち着いているが、あとで見返す時に時系列でわかりやすいものの、「あのアイディアはどの日付ファイルの中にあるのか?」と探す手間が生じて困っている。もしお勧めの音声メモ管理方法があれば教えてもらえると非常に嬉しい。

実際の音声メモを紹介

 実物がないとイメージが湧かないだろう。ここでは今までのメモのうちのいくつかを修正なしで紹介していきたい。一つ目は音声認識をしながらランニングに挑戦した、記念すべき初日のメモの一部である。帰宅したらすぐに推敲しないといけない理由もわかっていただけると思う。

走りながら仕事できる思ってウキウキして初めて見たけど、全然行かない。これからさらにチャレンジを続けていくべきかどうかわ。あと10時間ぐらいは使ってみてもいいかもしれないけれどもそれ以上使ってこれはさすがにまだハードルが高いと言うことなのかもしれない。野口さんはかなりのライフハッカーだからんだけど自分はそうじゃないからそのちょっとしたやり直しだったり面倒なことが非常に奥に関して逆に言えばそーゆーちょっとした面倒なこと。もしかしたら電波の良さが結構。

 音声認識の難しさに早くも挫折しそうになっているが、そういう時もあったなぁ…と懐かしい。次に、こちらは操作に不慣れな中、データが消えてしまったときの音声メモである。これは流石にストレスが溜まった。

じゃ間違えて音声認識の内容が全部消えてしまった。まず子供のこと音声認識モードのボタンが効かなくなったからけど1回アプリを閉じようとしてその前に隠してと、話した内容をコピーしておいたんだけど頑張っと微熱などできなかったみたいでEvernote に貼り付けることができたというと今一通り話したこと

 まだまだ読みづらい。次に、少し慣れてきた頃のもの。かなり整ってきているが、ランニング中でしかもWifiでない限りこれが上限に近いような気もしている。

自分はあまり疲れでないと思ってたも実は疲れてると言うことがあるのか、ということが最近わかってきてなので自分の疲れを可視化するか、もしくは自分が気づかないって言うそーゆーことだ。睡眠足りてなかったって言う可能性があるし、もしかしたら運動しすぎ。食事はちょっと整えてみる。

 自分の体調のコンディショニングを振り返っているメモである。ちなみにネット環境が整った室内で行うと、次のようになる。漢字の変換にミスがあるものの、かなり読みやすいことがわかる。

それでは、室内でネット環境が整ったところで音声メモが気に挑戦してみたい。ランニング中、つまり外出中の音声メモがひとどれくらいの差が生まれるのだろうか。

 私の結論としては、室内ではそこそこキレイに長文を書いていけるが、どうせ誤字脱字などをキーボードで変換するのであれば、最初からキーボードで書けばよいのでは、という考えに至っている。
 一方で、外出中やランニング中は長文を書くことは今の段階では厳しいので、アイディアの塊(数百字まで)をいくつか仕込んでおき、帰宅後にそれらを推敲したり、くっつけることで大きなまとまり(数千字)に編集しておくのが良い、という考えである。実例を見てがっかりした人もいるかしれないが、アイディアを蓄積するプロセスとしては音声メモは非常に有効である。

 また、読者を必要以上に煽るようなことはしたくないので、正直ベースで話すと、音声認識メモはそれなりのストイックさ、トライアンドエラーの精神が求められる。目に見える成果がすぐに返ってくるわけでもない。そのため、例えばPC単語登録を50個以上している人であれば、音声認識メモもお勧めしたい。そうでない人には強く勧めることはできない。

2020年の音声認識・仕事術を予想してみる

 ということで、まだまだ練習が必要な段階なのだが、途中経過として記事を書いてみた。ある程度、音声メモを習慣にすることには成功したので、最後に音声認識仕事術の未来について少し考えてみたい。果たして、「ランニング中にベラベラと音声を吹き込み、ランニングが終われば数千字のブログ記事や企画書の一つぐらい余裕で出来上がっていた」という夢のような状況が現実になる日は来るのであろうか?
 私の仮説(というより妄想)は、今すぐは起きないが、2020年までにそういう日が来てもおかしくない、というものである。日々進む音声認識エンジンの精度向上、ビジネスパーソン・ライフハッカー自身による音声メモスキル向上が見込まれ、どんどん音声メモが取りやすくなる。
 それに加え、Google Glassのような拡張現実型メガネの普及がもし起これば、ランニング中に、自分のメモ帳アプリを視界と重ねることができるようになるだろう。簡単な操作により、段落を入れ替えたり、部分的に書き直したりすることもできるようになるはずなので、ドラフトレベルの記事はランニング中に書けるようになるはずである。今は「小さいアイディアの数百字の文章の塊」をたくさん吹き込んでいるだけで、それだけでも非常に便利ではあるが、将来はもう少し小さい文章の塊をつなぎ合わせたり加工したりするレベルまで踏み込めるようになるのではないかと踏んでいる。文章完成までは行かないかもしれないが、ランニング後にベンチに座って、数分だけスマホで微調整して出来上がり、というシーンは想像しやすい。
 例えばブログ執筆を例にとっても、2003年頃まではHTMLなどの知識がそれなりに求められた。それは文章執筆と本質的には関連のない作業であるため、「私が文章に100%集中できる日は来るのであろうか?」と夢想していたライターがいたかもしれない。しかし、その数年後には、一切HTMLをいじらなくてもブログを更新できるようになったのは、ご存知のとおりである。
 同じように音声メモ作成は現時点では面倒な点が多いという意味では、2000年過ぎごろのウェブサイト制作に近いものを感じる。それに、あくまで妄想の範囲内だが、数年で状況がガラリと変わりそうな気配も感じなくもない。
 野口本の中で、「仕事のやり方が大きく変わった!これからますます変わっていく!」と大興奮しているのが伝わってくるが、ちょうど今の日本は仕事にまつわる価値観が転換点にあるように感じている人も多いのではないだろうか。労働時間、労働場所などの環境や考え方が激変していく中で、「音声認識・仕事術」というのは一つのキーワードになりそうな予感もする。
 ということで、いかがでしょう?興味のある人は試してみると良いと思います。


あわせて読みたい記事
toricago.hatenablog.com
toricago.hatenablog.com

広告を非表示にする