「対話」という言葉について確認しておくと、それはデジタルコンピュータの歴史において「ユーザとコンピュータのインタラクティブなやりとり全般」を指す比喩としても使われましたし、人間同士の対話に近いことを人間とコンピュータの間に実現する意味でも使われてきました。
1960年の「Man-Computer Symbiosis」(ヒトとコンピュータの共生)で、リックライダーは人間とコンピュータが緊密に連携しながら知的な活動を行うための条件を幾つか挙げました。一つは処理速度の課題であり、これは Time Sharing System (TSS)による解決が期待されていました。ここで最後に挙げられていたのが入出力装置の課題で、そこでは「対話」という言葉の幅を窺うことができます。
まずは、現代でいうタブレットとペンのような入出力装置がほしい。これは「effective man-computer interaction」のための課題としています。
次に、複数の人が共同作業する場にコンピュータが参加するための壁面ディスプレイがほしい。これは「cooperation between a computer and a team of men」のための課題としています。
最後に、自動的な音声合成と音声認識によるコンピュータとの意思疎通に触れています。これは「speech communication between human operators and computing machines」のための課題としています。
以上では、interaction、cooperation、communicationという言葉が登場しています。いずれも日本語では対話と関わりのある語といえますが、特にコンピュータの世界ではinteractionにあてられる日本語訳として「対話」がよく採用されています(これは誰が最初に訳したのでしょうね?)その一方で、タブレットとペンのような入出力装置を用いたやりとりを対話と呼ぶことは、この3つの言葉の中でもっとも比喩的であるように感じられます。音声で意思疎通することのほうがより直截に対話と呼べないでしょうか。
interactionに対して日本語の「対話」という言葉をあてるとき、わたしたちが「対話」として感じ取れることの幅は少し広がっているのではないかという気がしています。
リックライダーが旗を振ったその後の人とコンピュータの対話の様子について、Project MAC(1963年~)で確認しておきたいと思います。Project MACはリックライダーの資金提供によってMITのロバート・ファノが開発を進めたTSSで、最初期のTSSであるCTSSの後継とされています。Project MACは文献や実機デモの様子が残っているため、当時の様子がある程度わかります。
こちらの動画の5:15あたりから、ファノ本人がデモをしてくれます。端末はテレタイプで、タイプライターのようなキーボードから入力した内容は電話回線で繋がったリモートのコンピュータへ送信され、コンピュータからの応答が印字で返ってきます。
Robert Fano explains scientific computing (youtube.com)
1964年のプロジェクト進捗報告書では、このデモの内容を文字で確認できます。動画では何が印字されているのか判らないため有り難いです。
THE MAC SYSTEM: A PROGRESS REPORT (dtic.mil)
進捗報告書では、まずABSTRACTにおいて人間とコンピュータの共同作業のありかを「dialogue」と呼んでいることには注目しておきたいですね。
The notion of machine-aided cognition implies an intimate collaboration between a human user and a computer in a real-time dialogue on the solution of a problem,
Fig.2dにあるのは、素数を求めるプログラムをユーザが実行したときの様子です。下では判りやすいよう太字がユーザの入力、緑のItalicはコンピュータの印字した応答としました。
resume prime
W 1112.0
# EXECUTION.TYPE RANGE N1. TO N2. ON 2 LINES
1000000.
1001000.
PRIMES ARE
1000003
1000033
1000037
1000039
1000081
1000099
1000117(以下略)
resume primeは、prime(素数を求めるプログラム)の実行を指示しています。
Wはコンピュータが指示を了解したことを示す応答で、その時刻が後ろに続いています。
その後、コンピュータは「TYPE RANGE N1. TO N2. ON 2 LINES」つまり、求める素数の範囲を2つの数字で2行に分けて入力するようにユーザに要求します。ここは原文では次のように説明されています。
The PRIME program asked for the numbers N1 and N2 defining the desired range of prime numbers;
コンピュータがユーザに対して ask していますね!
ユーザが1000000と1001000を入力すると、コンピュータは「PRIMES ARE」から始めて1000000と1001000の間にある素数を全て応答します。
コンピュータがその場で質問を返してくるこの体験は、マッカーシーが述べていたような1回の入力から応答まで3時間から36時間はかかるコンピュータとのやりとりとは大きく異なっていますね。
もともとチューリングによる思考実験の水準では、テレタイプ越しにコンピュータと対話することが語られてはいました。その後、実際にテレタイプ越しでリアルタイム利用できるTSSが生まれたとき、これこそが人間とコンピュータが言葉で「対話」している様子なのだということを、ようやく実機の存在をもって論じることが可能になったようです。これが、アンカー(1)で触れたJohn Walkerの整理によるTSS世代のユーザインタラクションなのでしょう。