Mikrofon nie będzie potrzebny. Sposób generowania dźwięku przez POKEY okazuje się dość prosty. Podczas odczytu z dyskietki, na wyjściu AUDIO (pin37) pojawia się sygnał prostokątny 1Vpp (Voh=~5V, Vih=~4V). Na każdy wysłany lub odebrany bajt - dziesięć okresów (start, 8 bitów danych, stop) o częstotliwości równej prędkości transmisji (sprawdzałem to przy 19200baud). To oczywiście zbyt wysoka częstotliwość, aby była słyszalna. To, co słychać, to krótka (ok. pół bitu) przerwa na synchronizację generatora, pomiędzy bitem stopu bajtu n, a bitem startu bajtu n+1 (czyli ton o częstotliwości ok. 1800Hz), i, oczywiście, dłuższe przerwy między odbieranymi bajtami 'A'ck i 'C'pl. Nie zauważyłem żadnej zależności między zawartością danych, a generowanym dźwiękiem.
Z odczytem z kasety jest bardzo podobnie - najpierw odbiór dwóch bajtów AAh (ustalenie częstotliwości taktowania - brak dźwięku na wyjściu), potem prawie dokładnie tak samo, jak dla dysku, czyli dziesięć okresów częstotliwości taktowania na każdy odbierany bajt, z synchronizacją generatora każdym kolejnym bitem startu. Amlituda sygnału jest o około połowę mniejsza niż przy odczycie z dysku. Dodatkowo pojawia się (prawdopodobnie losowo - nie zauważyłem jakiejś zależności - na oko z prawdopodobieństwem bliskim 0,5 ) modulacja dźwięku podstawowego częstotliwością 31,666kHz o znacznie większej amplitudzie (łacznie 4Vpp) - ale raczej bez znaczenia dla brzmienia. To, co słychać, to ton podstawowy ~600Hz z nałożoną częstotliwością synchronizacji bajt/bajt - ~60Hz. Okresowa (na blok danych) zmiana brzmienia pochodzi stąd, że dla każdego bloku występuje pewna niedokładność określenia częstotliwości taktowania (nieco inna wysokość tonu podstawowego), a ona z kolei powoduje inną długość przerw na synchronizację bajt/bajt.
Na razie nie stwierdziłem przyczyny nieco innego brzmienia pustego bloku.