Kategorie
Pisze bo mogie.

Coś dla tych, któzy boją się z domu wychodzić.

Rzecz miała miejsce osiem lat temu, na przełomie listopada i gródnia roku 2010. Mieszkałem wtedy w Zielonce, to jest takie małe coś koło Warszawy. Miało przyjechać do mnie dwoje znajomych i w sumie to się udało, ale nie uprzedzajmy faktów. Ona pracowała w Warszawie, on miał dojechać z dość dalekich regionów kraju. Mięli się spotkać w centrum Wawy i razem do Zielonki dojechać. Zapowiedź tego, co się będzie działo potem można było zaobserwować koło połódnia gdy pogoda wykonała gwałtowny zwrot i z tzw. złotej jesieni przeszła w taaką zimę. Śnieg padał przez całe popołódnie, wieczór oraz chyba pół nocy i to konkretnie. Autobus na stacji Warszawa Zachodnia miał się pojawić jakoś po dwdziestej, ona kończyła przed siedemnastą. W związku z tym, że jesień do tego dnia utrzymywałą się raczej stabilnie ubrała się adekwatnie tj. niezbyt gruba kurtka, lekkie buty i takie tam. Po pracy pojechałą do centrum i zaczęło się oczekiwanie, na szczęście w cieple MC Donalda. Od razu zrobiło się śmiesznie, bo jemu rozładowała się komórka i udało mu się od kierowcy zadzwonić, że chyba się trochę spóźnią. Na szczęście ostatnie połączenie na mój przystanek uwzględnia nawet półtorej godziny obsuwy. Nie pozostało nic innego jak czekać. tym czasem okazało się, że to "trochę" cośkolwiek rośnie, po drugie komórkę udało się naładować, przy najmniej częściowo, co spokojnie wystarczyło, bo tydzień na jednej baterii to wtedy żadne dziwo. O 22 autobusw wieżdżał do Warszawy, a jednocześnie MC Donald się był zamykał. emy więc były dwa. Po pierwsze istniała szansa na to, że autobus do Zielonki odjedzie bez nich, po drugie coś trzeba było zrobić aby nie stać na mrozie w cienkiej kurteczce. Na tę drugą dolegliwość lekarstwo znalazło się dość szybko, a mianowicie Dworzec Centralny, bo tam otwarte 24/7. Oczywiście summa summarum autobus w Warszawie znalazł się jakoś po jedenastej tak więc już po ostatnim kursie autobusu do Zielonki. Możliwości były następujące: noc w dowolnym warszawskim hotelu, taxi do Zielonki ewentualnie autobus nocny. Ta ostatnia możliwość wydaje się najsensowniejsza, ale problem w tym, że przystanek jest gdzieś. Nie wiem do końca gdzie, bo nigdy nocnym nie jeździłem. Nic to. W zielonce taxi również istnieje więc nie ma problemu. Nocny z przed dworca centralnego odjeżdża przed pierwszą, koło drugiej jest w Zielonce. Wysiadają, oczywiście wiaty żadnej nie ma, wokół pustka, żadnych samochodów tylko zaspy po kolana, śnieg wciąż pada, a ona w jesiennym ubranku, jesiennych butach… Telefon na taksówkę i… nic. Jedna, druga nic. No więc warszawska korporacja jedna, druga… "przyjedziemy za dwie godziny", "za półtorej godziny, ale kurs musi być do Warszawy". Tymczasem zbliża się trzecia. Wokół nadal nic. Żadnych samochodów, ludzi… Jedynym wyjściem jest załadowanie punktu z przystankiem do Loadstone, bo tym programem dysponowałem i próba odnalezienia się w tym całym interesie. Wychodzę, idę ulicą, bo tu odrobinę mniej śniegu. Powoli zbliża się samochód. Na prawdę powoli. Zatrzymuje się.
– Pan chyba źle idzie, bo to ulica jest.
– Owszem, bo na chodniku śniegu jest jeszcze więcej
– a w ogóle gdzie pan zmierza?
– po znajomych na przystanek
– To pan wsiada. My też nie wiemy, gdzie to dokładnie jest, ale damy radę.
Jedziemy. GPS pokazuje, że to tutaj i wszystko prawie się zgadza. Jest słupek z nazwą przystanku, śnieg tylko znajomych nie ma. Dzwonię:
– Gdzie jesteście?
– no tutaj, na przystanku.
– ale szliście gdzieś?
– nie. Stoimy tam, gdzie się autobus zatrzymał.
– No to fajno, bo tu was nie ma.
– No jak to nie ma jak jesteśmy!
– No zwyczajnie, nie ma.
Jedyny wniosek jest taki, że wysiedli wcześniej albo później tj. ktoś coś źle powiedział. Żeby było śmieszniej ci państwo w samochodzie pojęcia nie mają, którędy jedzie autobus. Ja coś tam kojarzę jakieś nazwy przystanków i na tej podstawie próbujemy krążyć po okolicy. Tak przy okazji zbliża się 3:30. W końcu udaje się skompletować towarzystwo. Przed czwartą dojeżdżamy do mieszkania i cóż… tyle.
Z jednej strony przygoda jest z tych raczej niezbyt fajnych, ale z drugiej strony świadczy o tym, że nawet w tak nietypowej sytuacji można dotrzeć do celu. Teraz jest jeszcze łatwiej, bo niemal każdy smartfon ma mapy, możliwość sprawdzenia rozkładu jazdy, jest Be My Eyes i jeszcze parę appek. Jasne, że smartfon nie załątwi wszystkiego, ale mimo wszystko lepiej to wszystko mieć niż nie mieć.

Kategorie
Pisze bo mogie.

Jaki mikrofon jest każdy widzi, ale…

No właśnie. Przy mikrofonach różnistych danych jest jeszcze więcej niż w przypadku głośników, a mitów na ten temat nawet liczyć się nie chce. Trzeba to kiedyś wszystko wyprostować.
Sprawa jest dość skomplikowana już na dzień dobry, bo mikrofony można podzielić ze względu na kilka kryteriów. charakterystykę kierunkową, zasadę działania, zastosowanie, ogólny poziom profesjonalizmu :d. i może parę innych.
No to jedziemy od początku. Trzy najczęściej spotykane charakterystyki kierunkowe to kardioidalna, ósemkowa i dookólna. Najprościej będzie z charakterystyką dookólną, bo chodzi tu o "słyszenie" ze wszystkich stron tak samo. Przy najmniej w teorii, bo w praktyce bywa różnie. Kardioida to tzw mikrofony kierunkowe czyli takie, które "słyszą" dobrze tylko z jednej strony. òsemka jest dość rzadko spotykana, bo na mikrofon, który dobrze "słyszy" z przodu i z tyłu, a po bokach słabo zapotrzebowanie nie jest duże i spotyka się takie w niektórych studiach nagraniowych ewentualnie korzystając jednej z technik stereo, o których też kiedyś napiszę.
Podział ze względu na typ konstrukcji uwzględnia mikrofony dynamiczne, pojemnościowe, elektretowe oraz kilka rzadziej spotykanych jak np. wstęgowe. Tu kłania się najbardziej rozpowszechniony mit tj. "mikrofony pojemnościowe ze względu na wyższą czułość nie nadaje się do nagrywania np. podcastów, bo zbiera więcej pogłosu". Po kolei. Mikrofony dynamiczne to najprostrze konstrukcyjnie i do niedawna najtańsze, ale również niekoniecznie najlepsze pod względem jakości dźwięku. Są jednak bardzo często wykorzystywane chociażby na scenie, bo są w stanie znieść takie rzeczy jak wrzucanie w pośpiechu do pojemników transportowych, codzienne worzenie po wertepach, przewracanie statywów i inne takie.
W przeciwieństwie do nich pojemnościowe konstrukcje są znacznie droższe, delikatniejsze, z drugiej strony nieporównywalnie lepiej przenoszą dźwięk, a jako bonus potrzebują do działania zasilania przeważnie 48V. Najczęściej prąd podawany jest tym samym kablem, którym mikrofon przekazuje sygnał. Czasami zdarza się, że producent umożliwia podawanie zasilania z baterii, ale ten trend jest w odwrocie, bo tzw. zasilanie phantom jest obecne nawet w tanich przedwzmacniaczach dostępnych w niemal każdym mikserze. Osobną sprawą są konsumenckie karty dźwiękowe, dyktafony, proste rejestratory audio, kamery itd. tutaj zasilania phantom nie ma i raczej nie będzie, ale to nie znaczy, że skazani jesteśmy na mikrofony dynamiczne.
Uwaga, uwaga! przed państwem mikrofon elektretowy! Inaczej wstępnie spolaryzowany, jest niewiarygodnie tani, dość czuły, w miarę wytrzymały, wymagający co prawda zasilania, ale zaledwie 5V. W zasadzie z punktu widzenia użytkownika to taki trochę gorszy, mniej problematyczny, a przede wszystkim nieporównywalnie tańszy rodzaj mikrofonu pojemnościowego. Dlatego spotykane są przez większość z nas na codzień w smartfonach, laptopach, kamerkach, dyktafonach oraz większości rejestratoró audio, przy namniej tych za kilkaset zł. Dodawszy do tego fakt, że większość dostępnych na rynku mikrofonów komputerowych oraz niektóre odrobinę bardziej profesjonalne to też elektrety powoduje, że chyba wszystkie obecne konsumenckie karty dźwiękowe, dyktafony, smartfony i inne urządzenia z wejściem na mikrofon mają możliwość zasilania tego typu mikrofonów z resztą najczęściej domyślnie włączoną i często nie ma możliwości wyłączenia tego zasilania.
Pora na cyferki! Wziąłem na warsztat dane pierwszego lepszego mikrofonu ze sklepu muzycznego. Oto one:
Mikrofon pojemnościowy Audio-Technica AT2020
• charakterystyka kierunkowości: kardioidalna
• średnica membrany: 16 mm
• pasmo przenoszenia: 20 Hz – 20 kHz
• czułość: -37 dB (0 dB = 1 V/Pa)
• impedancja wyjściowa: 100 Ohm
• maks. SPL: 144 dB dla 1% THD przy 1 kHz
• poziom szumów własnych: 20 dBA
• stosunek sygnału do szumu: 74 dB, 1 kHz @ 1 Pa
• zasilanie: Phantom 48 V
• złącze: XLR
Po kolei.
• charakterystyka kierunkowości: kardioidalna – o tym pisałem i oznacza to, że jak większość tanich mikrofonów pojemnościowych dobrze zbiera dźwięki tylko z jednej strony.
• średnica membrany: 16 mm – zasadniczo im większa tym lepiej, ale i tak mębrany w elektretowych konstrukcjach są mikroskopijne w porównaniu z prawdziwym mikrofonem pojemnościowym.
• pasmo przenoszenia: 20 Hz – 20 kHz – to już opisywałem w poście dotyczącym głośników i tych, którzy tego nie czytali odsyłam do odpowiedniego fragmentu.
• czułość: -37 dB (0 dB = 1 V/Pa) – bardzo ważny parametr opisujący czułość, czyli coś jakby głośność mikrofonu. Im większa czułość tym potrzebne mniejsze wzmocnienie. W związku z tym, że większość z nas nie posiada sprzętu za tysiące lepiej mieć coś o wysokiej czułości, bo minimalizuje szumy urządzenia. Z drugiej strony im większa czułość tym większa szansa na przesterowanie samego mikrofonu w bardzo głośnym środowisku np. na koncercie pod głośnikiem.
• impedancja wyjściowa: 100 Ohm – Parametr istotny w profesjonalnych zastosowaniach jednak przy nagrywaniu w terenie sprzętem za kilkaset zł i tak nie ma z reguły możliwości dopasowania tego parametru.
• maks. SPL: 144 dB dla 1% THD przy 1 kHz – maksymalny poziom dźwięku, przy którym częstotliwość 1000Hpowoduje co najwyżej 1 procent zniekształceń generowanych przez mikrofon. Tu sprawa jest jasna – im więcej, tym lepiej.
• poziom szumów własnych: 20 dBA – im mniejsza wartość, tym mniejsze szumy generuje mikrofon.
• stosunek sygnału do szumu: 74 dB, 1 kHz @ 1 Pa – fizyk pewnie zrozumie bez tłumaczenia, ale większość z nas to nie fizycy. Jak może ktoś jeszcze ze szkoły pamięta, dźwięk to w gruncie rzeczy zmiany ciśnienia ośrodka, w którym się on rozchodzi. Głośność mierzona jest w decybelach, ale ciśnienie w Pascalach. Oznacza to wiec stosunek sygnału do szumu gdy mikrofon dostanie 1000Hz o ciśnieniu jednego Pascala. Im większy ten stosunek tym oczywiście lepiej.
• zasilanie: Phantom 48 V – to, co mówiłem. Mikrofon musi być zasilany napięciem 48V podawanym tym samym kablem, którym idzie zeń sygnał. Innymi słowy przedwzmacniacz, czy bardziej ogólnie mikser lub rejestrator musi być wyposazony w tzw zasilanie phantom. Z reguły ma to dość duży wpływ na zużycie baterii w rejestratorach. Mój Zoom h6 z włączonym phantomem jest w stanie pracować ok 3H.
Na koniec złącze XLR czyli zwyczajnie rodzaj wtyczki.
To mniej więcej tyle, ale jeśli będzie zapotrzebowanie to rozbuduję wpis o odpowiedzi na pojawiające się w komentarzach pytania.

Kategorie
Pisze bo mogie.

Święty sofcie, Święta substancjo, przeklęta religio!

Czytając niektóre dyskusje na forach, zwłaszcza tych bardziej informatycznych, czasem odnoszę wrażenie, że biorą w nich udział wyznawcy różnych wiar. Jedni poddają w wątpliwość interpretacje materiałów, które drudzy uznają za niemal święte, wzajemne próby szerzenia wiary w soft, którego dana osoba jest wyznawcą często biją na głowę sposoby wykorzystywane przez tych, co to chodzą po mieszkaniach z "dobrą nowiną", od wszelkiego rodzaju kacerstwa, wojen niemal krzyżowych aż chuczy. Nawet tutaj, tj. na Eltenie można spotkać fanatyków wiary w producentów różnego sprzętu i oprogramowania, którzy będą piętnować wszelkie działania mające na celu zdyskredytowanie objektu wiary.
Z drugiej strony i to mnie rzeczywiście dziwi często dyskusje na tematy religijne są niemal zakazane, a jeśli nawet nie to masa osób, tych samych, które na wsze sposoby próbują nawrócić niewiernych na ubóstwiany produkt uważają, że religia jest prywatną sprawą każdego z nas. A czy tak jest rzeczywiście? Załóżmy, przy najmniej na chwilę, że któraś wiara niech będzie Katolicyzm, bo to znam najlepiej jest rzeczywiście prawdziwa, tj. głoszone postulaty mówią o rzeczach, które takie faktycznie są. Co się stanie gdy ktoś się nie zastosuje do wiary? ano stanie się to, że będzie miał totalnie przesrane nie tylko w życiu doczesnym, ale również po śmierci. Sprawa jest więc stokroć poważniejsza i wymagająca znacznie szerszego przedyskutowania niż używanie takiego albo innego komunikatora internetowego, antywirusa, systemu operacyjnego, dokonywania aktualizacji wspomnianego systemu w taki albo inny sposób itd itp. Dodatkowo należy pamiętać, że podstawową zasadą wiary jest hm… wiara właśnie czyli każdy wierzący uważa, że będzie tak, jak naucza wiara, którą wyznaje. Katolik będzie więc uważał, że modlitwa, pełne uczestnictwo w mszach świętych, przyjmowanie sakramentów i inne takie rzeczywiście pomaga i to nie tylko kiedyś tam, w zaświatach, ale tu i teraz. Z punktu widzenia katolików wszelkie inne wiary są nieprawidłowe, tak samo jak zagorzały Iphonowiec będzie wszystkich przekonywał, że Android jest zwyczajnie gorszy, będzie to udowadniał, w rozmowach, pokazywał swój genialny telefon z logiem nadgryzionego jabłka itp. Dlaczego więc ludzie, którzy w dyskusjach zrównują z błotem nie tylko przeciwników stawianego przez siebie na piedestale rozwiązania, ale nawet tych nie do końca przekonanych oburzają się śmiertelnie na jakiekolwiek dyskusje na temat wiary?

Kategorie
Pisze bo mogie.

PZN jako generator anegdot.

Jako, że jestem odcięty przez parę tygodni od swoich ulubionych dźwiękowych zabawek, a po za tym mamy wakacje, trzebaby w końcu napisać o czymś luźniejszym, chociaż sytuacja, którą zamierzam opisać nie dla wszystkich taka luźna będzie, ale do rzeczy, jak mawiał tragaż biorąc się za kufry.

Dolnośląski okręg PZN, godzina… koło dwunastej. Tomecki idzie sobie korytarzem i szuka toalety mając włączony OCR czasu rzeczywistego, bo przecież braila w Polskim Związku Niewidomych próżno szukać. Po paru metrach zwalnia kroku i decyduje się na małą rozmowę z dyrekcją. Pokuj blisko, żadnych sekretarek nie ma więc co tam. Ostatecznie Tomecki tu na parę tygodni tylko, w razie czego dziura w niebie się nie zrobi jeśli coś pójdzie nie tak.
"dzień dobry, czy mógłbym wiedzieć, czemu w Polskim Związku Niewidomych osoby najbardziej zainteresowane tj. niewidome nie mogą sami dotrzeć do określonego miejsca z braku żadnych informacji pisanych brailem?" Dyrektorka teatralnie załamuje ręce, uśmiecha się tryumfalnie i zagarniając Tomeckiego ramieniem mówi z oburzeniem "jak to nie ma braila! zaraz panu pokarzę!". Oboje idą, krótkim z resztą, korytarzem i wreszcie dochodzą do klatki schodowej. Tomecki w myślach zastanawia się czy może czegoś nie pominął, jakiejś tablicy? mapy? opisu? Tym czasem dyrektorka gorączkowo grzebie po regale najwyraźniej w poszukiwaniu czegoś i w końcu… "a nie mówiłam! proszę!" Tomecki bierze z rąk dyrektorki coś jakby zeszyt, który istotnie wygląda, jakby wewnątrz zawierał coś wypukłego, otwiera pierwszą stronę i rzeczywiście! Jest brail! jest napis! Na górze strony, wyrównane do środka widnieje dość dobrze zachowane słowo "Promyczek".

Kategorie
dźwiękownia Pisze bo mogie.

magiczne cyferki przy głośnikach.

Na początek mała uwaga. Nie jest to poradnik dla profesjonalistów tylko dla ludzi, którzy nie wiedzą czym jest rms, czym się różnią głośniki aktywne od pasywnych i zasadniczo nie potrzebują tworzyć taakich super instalacji audio.Zazwyczaj kupując głośniki mamy kilka różnych bardziej, lub mniej zrozumiałych cyferek w specyfikacji. Jedne są mniej, inne bardziej naciągane i, co oczywiste, mają przyciągnąć naszą uwagę i zachęcić do kupienia tego, a nie innego sprzętu. Na co zwracać uwagę, co olać, na co uważać?
Od początku. W przypadku tzw. aktywnych głośników czyli takich, które mają wbudowany wzmacniacz pierwszym i niby najważniejszym parametrem wydaje się moc. Przy okazji już odpowiadam na pytanie "a skąd niby mam wiedzieć, czy mam aktywne głośniki?" Jeśli podłączasz je bezpośrednio do karty dźwiękowej, smartfona czy innych takich to masz głośnik aktywny. Jeśli trzeba między sprzętem, a głośnikiem wzmacniacza, to to są głośniki pasywne. drugą wskazówką może być umieszczenie włącznika, pokręteł głośności, regulacji barwy itd na głośnikach no i wzmacniacz wymaga zasilania, więc jeśli głośnik trzeba podłączyć do prądu lub jest zasilany np. akumulatorem czy inną baterią to jest to głośnik aktywny.
Ok, przechodzimy do mocy. Jeśli chodzi o głośniki komputerowe czy tam przenośne to ten parametr, wbrew pozorom, nie jest zbyt istotny. Tak na prawdę jest to jedna z tych wartości, którymi producenci lubią sobie nagiąć rzeczywistość. Teoretycznie rzecz biorąc waty to waty i niby co tu możma podkręcić? ano można dość dużo. Np. zsumować moce wszystkich użytych wzmacniaczy i podać jako jedną wartość, x lat temu można było nie podawać tzw rms, czyli mocy ciągłej. Producent podawał moc chwilową, która mogła być niemal dowolnie duża. Tak czy tak, moc absolutnie nie odzwierciedla barwy dźwięku, ilości basu, ani nawet w gruncie rzeczy maksymalnej głośności. Ten wskaźnik mówi tylko o tym, ile prądu wzmacniacz jest w stanie przekazać do głośnika i to w idealnych warnkach. Co z tym zrobi głośnik to już zupełnie inna sprawa. Jasne, że 5W a 400W zobrazuje jakoś tam, że jednak w tym drugim przypadku będzie zdecydowanie lepiej, ale 40W, a 65W to już niekoniecznie musi być takie oczywiste.
Przechodzimy do pasma przenoszenia. Pasmo przenoszenia określa najniższą i najwyższą częstotliwość, którą jest w stanie wygenerować głośnik lub poprawnie przenieść mikrofon. Tłumacząc z polskiego na nasze, jak nisko schodzi bas i jak wysoką ma tzw. górkę czyli soprany. Wszystko fajnie, ale nigdy nie ma tak, że głośnik gro od tylu, do tylu i szlus. Są zakresy dźwięku, w których głośniki ledwo, ledwo, inne częstotliwości są aż zbyt głośne itd. Innymi słowy jeśli odpowiednio określić zakres głośności, w którym akceptujemy odtwarzanie częstotliwości to i głośniczek wbudowany w smartfon będzie miał parametru taaakiego drogiego zestawu. Dlatego też w przypadku szanujących się firm audio określa się zakres głośności, w którym jest badane pasmo przenoszenia. Jeśli producent napisze, że w przedziale plus minus 10db głośnik gra w zakresie 40, 2000Hz oznacza to, że żadna z częstotliwości z tego przedziału nie będzie głośniejsza lub cichsza niż 10db od średniej. W przypadków dobrej jakości zestawów studyjnych lub audiofilskich z prawdziwego zdarzenia z reguły wymogi są jeszcze bardziej restrykcyjne i obejmują zakres +-3db co jest już na prawdę niewielką zmianą głośności. Na temat częstotliwości jeszcze nie pisałem, ale to wymaga raczej prezentacji audio i na pewno taki wpis się kiedyś pojawi.
W przypadku studyjnych, nawet z niskiej pułki, głośników istnieje jeszcze kilka innych parametrów. Max spl czyli maksymalny poziom ciśnienia akustycznego, a po ludzku jakie to faktycznie może być głośne i to jest wyrażane w db. Często dodawana jest informacja o tym, jakiej tzw krzywej użyto podczas pomiaru. Chodzi tu o to, że słuch ludzki nie jest liniowy, czyli różne częstotliwości odbieramy z różną głośnością. Różne krzywe uwzględniają różne modele odbierania częstotliwości. Z regutaki poziom badany jest w odległości metra ale zawsze lepiej, gdy producent o tym napisze wprost, bo nigdy nie wiadomo kto i gdzie nie zechce sobie podnieść statystyk.
prócz tego możemy znaleźć informację na temat klasy wzmacniacza. Określa to mniej więcej to, ile energii idzie niekoniecznie w dźwięk tylko np. w ciepło. Im niższa wartość tym lepiej, z jednym wyjątkiem. Klasa D oznacza wzmacniacz cyfrowy, który, z tego co wiem, rządzi się trochę innymi prawami, jednak nie jestem elektrykiem więc proszę nie oczekiwać ode mnie szcegułów.
Zostają kwestie średnicy i materiałów, z których wykonane są głośniki. Nieco upraszczając, im większy tym lepiej będzie sobie radził z niskimi częstotliwościami, ale z górką będą problemy. Dlatego kolumny głośnikowe wyposarzone są w dwa lub więcej głośników. Osobny, mały dla wysokich częstotliwości i znacznie większy dla przenoszenia basów. Oczywiście różne laboratoria kombinują jak tu zrobić, żeby było tanio, mało miejsca zajmowało i fajnie grało. Pomysłem, który ostatnio trafia pod strzechy jest użycie tzw mębran pasywnych, czyli dość ciężkich, zrobionych z czegoś co wygląda jak bardzo gruby plastik mębran, które sprawiają, że mały, przenośny głośnik jest w stnie zagrać jak sporo większy, jednak bez takiej mębrany.

Kategorie
dźwiękownia Pisze bo mogie.

mamy w głowie empetrójkie, czyli jak słyszymy.

Ten wpis jest, jak do tej pory, najdłużej przygotowywanym postem. Problem w tym, żeby napisać jak najbardziej ciekawie, jednocześnie wgłębiając się odpowiednio w mechanizmy słyszenia. Żeby nie było zbyt nudno, teorii słyszenia tak w ogóle jest kilka i tęgie głowy ciężkie dyskursa wiodą na temat tego, która lepsza, a jeśli przechodzimy do problemów pt. szumy uszne zaczynają się dyskusje prowadzone niby po Polsku, ale połowy słów normalny człowiek nijak nie zrozumie, a wszystko dlatego, że tu w ogóle nie wiadomo skąd się to to bierze, ale od początku.
ucho zewnętrzne, środkowe i wewnętrzne to pojęcia znane prawie każdemu po szkole. Kowadełko, młoteczek strzemiączko często również, ale na cholerę to wszystko? Okazuje się, że uszy to bardzo ciekawy wynalazek poziadająco zaskakująco ciekawe rozwiązania techniczne. Chociażby taka niby prosta rzecz. Każdy wie, że uszu mamy dwoje, a mimo wszystko jesteśmy w stanie lokalizować dźwięk we wszystkich trzech wymiarach. Równocześnie wiadomo, że dwa głośniki to stereo, czyli lewo prawo i wsio. Dobiero co najmniej cztery głośniki pozwalają określać dźwięk bardziej w przestrzeni, jednak i tak brakuje wtedy tego trzeciego wymiaru – góra / dół. Zbyt łatwe? no to dodajmy sobie jeszcze fakt, że używając słuchawek można usłyszeć dźwięk np. na górze i z tyłu, jednak odtwarzając to samo na głośnikach wrażeni praktycznie znika. Okazuje się, że kształt naszych małrzowin ma znaczący wpływ na lokalizację źródła dźwięku przez nieznaczną, jednak superistotną dla mózgu zmianę jego parametrów. Żeby było śmieszniej, nie znamy dokładnego algorytmu obliczania tych parametrów i aby zasymulować dźwięk 3d musimy skorzystać z czegoś, co się zwie odpowiedzi impulsowe czyli odpowiednio wypreparowane nagrania testowe.
Ciekawostka numer dwa: różne częstotliwości słyszymy z różną głośnością. To wynika z kształtu małrzowin, kanału słuchowego i paru innych tego typu czynników, które miały pewne znaczenie daawno, dawno temu, zanim urodziły się mumie, a człowiek z maczugami albo i bez nich polował na różne, dziwne stwory. Gdy facet ruszał na polowanie, zostawiając rodzinkę gdzieś tam musiał wiedzieć gdy coś złego się dzieje np. dzieciom. Zauważcie, że gdy dziecko się boi potrafi bardzo wysoko piszczeć, a ten dźwięk jest dość denerwujący, przenikliwy i generalnie dobrze słyszalny, mimo różnych innych odgłosó otoczenia. Właśnie tego rzędu częstotliwości są wzmacniane przez nasz kanał słuchowy. Jego kształt, zamkniętej z jednej strony rurki powoduje, że działa on jak piszczałka, a piszczałki mają to do siebie, że bardzo chętnie wzmacniają jedną, określoną częstotliwość. W tym przypadku ok. 3000, 4000Hz i to jest właśnie ta częstotliwość, którą wydaje dziecię drące się w niebo głosy.
Kolejnym zjawiskiem,często rejestrowanym przez imprezowiczów, o ile ogólny stan na to im pozwala, jest chwilowy problem ze słuchewm po wyjściu z imprezy, zwłaszcza gdy taki jeden z drugim stoi pod głośnikiem. To również naturalny mechanizm, tym razem znajdujący się w uchu środkowym. Są tam dwa mięźnie odpowiedzialne za napięcie błony bębenkowej oraz ruchy trzech kosteczek tj. młoteczka, kowadełka i strzemiączka, odpowiedzialnych za przekazywanie dźwięku dalej, do ucha wewnętrznego. Gdy te mięźnie pracują błona się napina, więc trudniej wprawić ją w drganie, prócz tego system trzech wymienionych kosteczek również gorzej działa, więc i przekazywany dźwięk nie jest tak głośny. Celem tego mechanizmu jest ochrona po pierwsze błony bębenkowej aby nie stało się z nią nic złego pod wpływem zbyt dużej amplitudy drgań, po drugie ochrona dalszych mechanizmów słyszenia, które również nie są niezniszczalne. Tu pojawiają się dwa ciekawe problemy związane z tym interesem. Po pierwsze mechanizm potrzebuje ok. pół sekundy na aktywację tak więc nagłe i głośne dźwięki np. wybuch może być gorszy od ciągłego szumu nawet równie głośnego, jednak to też nie do końca prawda, bo jak każde mięźnie, te również się męczą i po jakimś czasie odpuszczają, a mębrana zaczyna coraz większe harce. Wychodzi na to, że jeśli już musi coś zagrzmieć to najlepiej gdy jest to stopniowo narastający i niezbyt długo trwający dźwięk.
Teraz zaczynamy jazdę z uchem środkowym, które swego czasu wywołało sporą sensację w światku uchogrzebaczy. Jest tam takie coś, co się zwie narządem lub organem Cortiego. Tam zachodzi przemiana fali akustycznej na elektryczną, która via nerw słuchowy wędruje sobie do naszego bioprocesorka. Tu zaczynają się niezłe jaja, bo, uwaga! do mózgu nie dochodzi pojedyncza fala dźwiękowa, a zamiast tego dostaje setki pojedynczych częstotliwości, z których składa sobie sam odpowiednie wrażenia. No i tu właśnie panuje kilka teorii na temat tego, jak to się w zasadzie dzieje. Nie ma sensu wgłębiać się w nie, bo są strasznie mądre i z praktcznego punktu widzenia nie wnoszą do sprawy niczego mądrego, jednak tu również warto napisać o pewnym ciekawym rozwiązaniu. Jest coś takiego co się nazywa komórki rzęskowe, które odpowiedzialne są za tworzenie impulsów elektrycznych do nerwu słuchowego. Jest ich strasznie dużo, bo raz, że jedna taka komórka odpowiada za konkretną częstotliwość, dwa, każda komórka jest kilkukrotnie zdublowana. Po co? ano, bo po każdym wygenerowaniu impulsu taka komórka musi mieć chwilę na ponowne "naładowanie". Im człowiek bardziej zmęczony tym ten czas potrzebny jest dłuższy. Nie wiem czy również macie czasem takie wrażenie, gdy już, jak to mówią, chodzicie na rzęsach, że klaśnięcie lub inne tego typu dźwięki powodują wrażenie chwilowych problemów ze słuchem, takiej jakby megakrótkiej utraty słuchu, a przy najmniej zciszenia dźwięków. To właśnie problemy z ładowaniem tych komórek rzęskowych.
Ten mechanizm ma niestety również coś do powiedzenia w chorobach słuchu, bo jeśli któryś zespół komórek rzęskowych lub inna część tego mechanizmu ulegnie uszkodzeniu może się okazać, że nie jesteśmy stanie słyszeć pewnych częstotliwości. Wtedy mogą się pojawić problemy np. z rozumieniem mowy, jednocześnie z przewrażliwieniem na jakieś inne dźwięki np. ruch uliczny. Prawdodobnie również ten mechanizm gdy się "zepsuje" odpowiedzialny jest za powstawanie tzw szumów usznych, jednak na temat ich powstawania to dopiero jest dużo teorii!
Cóż, nie mam pomysłu na jakieś sensowne zakończenie tego wpisu, więc powiem tyle: Może się jeszcze okazać, e to co pisałem nada się jedynie dla celów archiwalnyhch, bo nikt nie mówi, że wszystko wiadomo i może czeka nas jakaś rewolucyjna teoria?

Kategorie
dźwiękownia Pisze bo mogie.

16bit, 48kHz, 128kbps – o co w tym wszystkim chodzi?

Podwaliny pod współczesny zapis audio stworzyło tzw twierdzenie Shannona, a zasadzie jedno z jego twierdzeń uzupełnione przez paru innych mózgowców. Wgłębiając się w wikipedię dowiemy się różnych dziwnych rzeczy o sygnałach dyskretnych, dziwnych wzorach itp, ale przekładając z Polskiego na nasze chodzi o to, że jest możliwe zapisać audio przy pomocy zer i jedynek w sensowny sposób. Teraz czas na wyjaśnienie jak to się dzieje. Otóż jak pewnie części z was wiadomo mikrofon to w gruncie rzeczy takie szprytne urządzenie, które zamienia dźwięk na prąd. Tenże prąd wędruje sobie kabelkiem do karty dźwiękowej i… no właśnie, teraz ten prąd trzeba zamienić na cyferki. Może ktoś jeszcze pamięta, że dźwięk to fala. Co tu faluje? poniekąt powietrze, chociaż może to być niemal dowolny inny ośrodek, jednak żeby nie komplikować skupmy się na powietrzu. Waląc np. w bęben lub drąc tzw ryja wprawiamy niektóre cząsteczki powietrza w ruch drgający, który ma na tyle dużą energię, że jest w stanie wprawić również w drganie mębranę mikrofonu. Jak już wcześniej wspomniałem dalej zamienia się to w prąd i w takiej formie dociera do karty dźwiękowej. W efekcie mamy prąd o bardzo szybko zmieniającym się napięciu. Jak zapisać tego typu sygnał wymyślił właśnie Claude Shannon. Jego metoda jest w gruncie rzeczy bardzo prosta należy co chwila badać wartość, w tym przypadku napięcia prądu i zapisać je w formie liczby. W ten sposób otrzymamy w cholerę wartości napięcia, które, gdy je zamienić z powrotem na prąd otrzymamy w miarę podobny do oryginału sygnał. Taki zapis cyfrowy zmieniającego się sygnału nazywamy jego zpróbkowaniem, a dźwięk zapisany tą metodą określamy PCM czyli pulse code modulation, a po polskiegu modulacja kodowo impulsowa. Prawda, że proste? :d.
No fajnie, ale gdzie tu te Hertze, bity itd?
Taqki sygnał można po pierwsze zapisać w różnych odstępach czasu i jak się można domyślić im częściej zapiszemy stan napięcia, tym dokładniejszy ten zapis będzie. Kłaniają się więc Hertze czyli częstotliwość zapisywania zmian napięcia. Teraz czekam na pytanie typu "ale granicą słyszalności człowieka jest podobno 20000hz więc na cholerę te 48000?" tiaaa. obawiam się, że trzeba będzie wprowadzić kolejny termin, a mianowicie częstotliwość Nyquista. Znowu w Wikipedii mamy masę wzorów, zakręconych definicji itd, bo przecież trzeba udowodnić, że to faktycznie działa, ale ja tego ni cholery nie rozumiem. Jednak da się to jakoś tam wyjaśnić bez uciekania się do matematyki, którą chyba tylko Dawid zrozumie. Aa, nie napisałem o co chodzi? no to: maksymalna, poprawnie zapisana częstotliwość jest dwkrotnie mniejsza niż częstotliwość próbkowania czyli tę, z jaką zapisujemy sygnał. Najprościej wyjaśnić to w ten sposób, że aby zapisać jakąś falę trzeba zaznaczyć przy najmniej jej minimum i maksimum, tak więc na zapisanie pełnego okresu fali w tym przypadku trzeba wykorzystać dwa zapisy. To oczywiście znacznie uproszczone wyjaśnienie, bo zostaje jeszcze tzw aliasing czyli problem z częstotliwościami wyższymi niż maksymalne, które bez odpowiednich filtrów wprowadzają potworne śmieci i zgrzyty do oryginalnego dźwięku, ale to już komputery robią bez naszego udziału i tym zdecydowana większość z nas zajmować się nie będzie, a tym, którzy jednak mięliby takie pomysły odsyłam do taakich mądrych siążek, z taaakimi wzorami. Podsumowując mając częstotliwość próbkowania 48kHz czyli 48000Hz możemy maksymalnie zapisać dźwięk o częstotliwości 24000Hz czyli cały zakres słyszalności człowieka plus jeszcze trochę na wszelki wypadek no i ewentualne problemy z filtrami usuwającymi śmieci i zgrzyty.
Zostają jeszcze bity. Wspomniałem, że napięcie jest zapisywane co pewien czas, ale tu pojawia się pytanie – jaki jest zakres liczb? czyli jaka jest różnica między minimum a maksimum. To właśnie określa ilość bitów. Mając informację, o 16bitowym dźwięku można obliczyć, że mamy 65536 możliwych stanów i tu po wyjaśnienia odnośnie systemów liczbowych odsyłam do Dawida, bo chyba on to najlepiej wyjaśni. Ja mogę jedynie dodać, że każdy dodatkowy bit zwiększa ilość wartości dwókrotnie, czyli dodawszy informację z poprzedniego wpisu zwiększa dynamikę sygnału o 6db. Dynamika sygnału to różnica miiędzy minimalnym a maksymalnym poziomem zapisanego dźwięku. Co prawda zostaje jeszcze coś, co się nazywa dithering, czyli dodanie szumu do dźwięku, bo jeśli ilość bitów jest mała np. 8 to dynamika wynosi 6*8 czyli, o ile jeszce mnożyć umiem, 48db. Mówi się, że od progu słyszalności do tzw progu bólu jest 120db różnicy. Trochę jakby więcej i pojawia się problem pod tytułem, co w związku z tym? ano w takim przypadku dźwięk jest w specyficzny sposób zniekształcony i aby te zniekształcenia były łatwiejsze dla człowieka do zniesienia dodaje się właśnie szum, ale to taka ciekawostka, bo to większość programów też robi sama, chocaż co bardziej zaawansowane dają możliwość wyboru typu tego ditheringu, ale to dla tych, co to myślą, że tyyle wiedzą, co nota bene nie zawsze mija się z prawdą.
Pozostaje ostatnia rzecz czyli tzw. szybkość transmisji. To jest nieco inne spojrzenie na dźwięk, a mianowicie nie interesuje nas częstotliwość próbkowania, ilość bitów tylko to, ile miejsca na dysku ma zająć sekunda nagrania, a parametry ma dobrać program. Takie potraktowanie sprawy jest popularne głównie w przypadku tzw stratnej kompresji dźwięku, bo w tym przypadku ilość parametrów jest niejednokrotnie przyprawiająca o ból głowy, wyjaśnienia są znacznie bardziej skomplikowane niż banalne twierdzenie Shannona, a liczby zespolone to wstęp do wprowadzenia w zarysie. Dlatego użytkownik ma określić jak duży ma być wyjściowy plik i tyle jego. Inna rzecz, że wiele kodeków oferuje dla tych, co to lubią robić po swojemu różne dziwne przełączniki, ale to już rzecz na zupełnie inny wpis, a nawet szereg wpisów.
Na koniec odrobina prostej, nawet dla mnie, matematyki. Takie małe ćwiczonko: obliczmy sobie szybkość transmisji dźwięku stereo 16bit, 48kHz. Od początku: mamy 16bitó, czyli na marginesie dwa bajty, na próbkę. Mnożymy to przez ilość tychże próbek na sekundę, czyli 48000, otrzymujemy 768000 i wszystko razy dwa kanały i wychodzi 1536000 czyli półtora megabita. Teraz oczywiście można rzecz ciągnąć dalej i policzyć ile wyjdzie na minutę – 92160000, a godzina to 5529600000 oczywiście bitów, czyli 691200000 bajtów czyli 691,2 megabajtów. uff! I tym może optymistycznym akcentem….

Kategorie
dźwiękownia Pisze bo mogie.

Dziwna skala decybelowa

Niektórzy z was pewnie wiedzą, że w skali decybelowej nie mierzy się jedynie dźwięku, lae spotkać ją można np. w mierzeniu sygnału radiowego i ewentualnie paru innych sytuacjach. Jak to jest, że prędkość, temperatura, praca, napięcie prądu mają swoje jednostki, a tu nagle tak niby różne rzeczy jak dźwięk i fale radiowe nagle mierzy się w decybelach? Możnaby pomyśleć, że to i to jest falą, więc coś tu może być na rzeczy, ale zaraz przychodzi pan fotograf i mierzy światło w lumenach albo innych luksach i ząg. A czy możnaby mierzyć np. prędkość w decybelach? okazuje się, że w pewnym sensie można, tylko byłoby to trochę niewygodne. Czemu? bo skala decybelowa to na prawdę dziwny, przy najmniej dla większości ludzi, twór. Działa to tak: ustalamy sobie umowną wartość, która w skali decybelowej jest zerem i teraz uwaga: 6db to wartość dwa razy większa, 12db czterokrotnie więcej, 18db to już osiem razy więcej itd, czyli każde 6db to dwókrotność poprzedniej wartości. Tak samo jest z liczbami ójemnymi, tj -6db to dwa razy mniej niż 0db, -12db to cztery razy mniej niż 0db itd. chcąc mierzyć prędkość w decybelach trzebaby założyć gdzie jest 0db. Gdyby ustawić to gdy samochód sobie stoi to nagle pojawia się problem, bo przecież można zero mnożyć dowolną ilość razy i jak wół zawsze wyjdzie zero, przy najmniej tak w szkole uczą. No więc niech zero będzie przy 10km/h. W ten sposób gdy jedziemy z prędkością 6db to mamy na standardowym liczniku 20km/h. 12db to już mamy czterdziestkę, a 24db to zasuwamy 160 na godzinę, a 30db to niebagatelne 320km/h. Za to -6db to 5km/h, a gdy stoimy to licznik powiniem pokazać odwróconą ósemkę po minusie.
Czemu więc w takiej dziwnej skali mierzymy dźwięk i czemu to działa? ano dlatego, że dźwięk to, jak w szkole uczą, zmiany ciśnienia powietrza. Rejestrowany przez nasze uszy przedział tych zmian jest zaskakująco wielki i gdyby mierzyć to w standardowy sposób okazałoby się, że szept to jakieś ułamki z dużą ilością zer, a wybuch to sześcio lub więcej cyfrowe liczby.
Wniosek: 0db to NIE jest cisza absolutna, tylko tzw próg słyszalności czyli uśredniony próg, w którym człowiekowi wydaje się, że może coś ta słychać. Nie zmienia to faktu, że mog być dźwięki o poziomie np. -8db, ale przeciętny człowiek nie jest w stanie tego zarejestrować.
Kolejną ciekawostką jest wyznaczenie 0db w cyfrowych systemach dźwięku. Wartość ta równa się maksymalnemu poziomowi, jaki system jest w stanie zarejestrować czyli taki, tu info dla informatyków, który zapisany jest przy pomocy samych jedynek. Wynika z tego, że w cyfrowym świecie audio, wszelkie głośności mają na początku przyklejony minus.

Kategorie
Pisze bo mogie.

Uczę się, choć nie wiem czemu czyli filozofia zastraszająco dużej liczby niewidomych.

Obserwując Eltenowe forum jak również parę innych miejsc, w których wypowiadają się niewidomi widzę, że wiele interesuje się dźwiękiem, informatyką, coś tam próbuje pisać, śpiewać, komponować itp. Problem w tym, że prawie nikt nie robi z tym nic aby stało się to jego sposobem na życie. Ogromna większość niewidomych żyje albo za najniższą krajową pracując albo jako telemarketerzy albo, o zgrozo, w wymysłach pokroju Niewidocznych. A przecież wiele osób ma ukończone studia, ma ogromną wiedzę z takiej lub innej dziedziny więc skąd się bierze ta statystyka? czy to niewiara w nasze możliwości? może w ludzi albo w tzw. system? Najprostszy przykład: Chodziłem do Krakowa na realizację dźwięku w tej szkole dla niewidomych na Tynieckiej. Prócz mnie było oczywiście parę niewidomych uczniów, jednak gdy próbuję się dowiedzieć gdzie oni wszyscy pracują nie ma praktycznie nikogo, kto robiłby coś z dźwiękiem. Na jaką więc cholerę wam te dwa lata w szkole? chciałoby się napisać. Sam, nie chwaląc się pracuję jako realizator dźwięku w wydawnictwie audiobooków więc proszę mi nie mówić, że się nie da. Inna rzecz, że prawdopodobnie gdyby ktoś mnie motywował od samego początku pewnie mógłbym być już znacznie dalej na drodze kariery zawodowej. Ile miałem zmarnowanych przez jakieś takie poczucie, że nie dam rady szans! Ile niewykorzystanych możliwości! Ile miesięcy czy lat siedziałem w domu gdy tymczasem wystarczyłoby, żebym…
Pamiętam gdy zdawałem na reżyserię dźwięku jeden z wykładowców oświadczył rozbrajająco, że wolałby uczyć głuchego niż ślepego, bo dzisiaj realizacja dźwięku to głównie patrzenie na wykresy. Obserwując współczesny rynek muzyczny jestem w stanie się z nim zgodzić, ale dzisiaj nie o tym. Poddałem się i Zrezygnowałem, ale teraz wydaje mi się, że trzeba było się uprzeć i próbować. A bo to wiadomo kogo bym poznał? gdzie miałbym praktyki? a może ktoś przyjąłby mnie mimo wszystko? może, może, może… Jedna ze zmarnowanych szans. Na koniec apel do, obawiam się, większości czytelników tego wpisu: bardzo proszę, zamiast mnożyć przed sobą bardziej lub mniej rzeczywiste problemy bierzcie dupę w trok i do roboty!

EltenLink