– Vi har gjort målinger i nettverket vårt og funnet at 37 prosent av alle terminaler støtter HD Voice, sier leder for taleteknologi i Telenor, Morten Ramberg. Foto: Telenor

HD VOICE: DEN NYE STEMMEN

Telenor har lansert HD Voice i sitt mobilnett, men det krever foreløpig 3G-dekning. Netcom starter implementeringen av HD Voice etter påske.

Vi forklarer teknologien lenger ned i artikkelen, men først litt om operatørenes planer og hva som kreves for å få HD Voice. For det første må telefonene i begge støtte den nye talekodeken.

Fra Telenor får vi vite at kodeken ikke vil fungere mot fasttelefoner, fordi dette nettet er begrenset til 3.400 Hz. Derimot har Telenor gjort målinger i nettverket sitt, og funnet at 37 prosent av alle m støtter den nye talekodeken. De aller fleste smartmobiler av nyere dato støtter HD Voice, unntaket er Apple hvor bare Iphone 5 har slik støtte. Mange av Samsungs modeller trenger dessuten en programvareoppgradering. Senere i år vil Telenor implementere teknologien i 2G-nettet, selv om terminalsituasjonen gjør at effekten av dette er begrenset.

De som synes det er god lyd i mobiltelefoner, mener det sannsynligvis fordi de ikke vet bedre

Også Netcom vil lansere HD Voice. De har programvare og lisenser på plass, og vil starte opp like over påske. Først i Drammensområdet, til sommeren vil trolig det meste av Sør-Norge være klart. Deretter vil selskapet konsentrere seg om Nord-Norge.

Vet ikke bedre

De som synes det er god lyd i mobiltelefoner, mener det sannsynligvis fordi de ikke vet bedre. Akkurat som vi var fornøyd med TV-bildet før HD-TV.

De siste årene har vært preget av HD. Spesielt på TV skal alt være i «høy definisjon». Selv mobiltelefoner kan ta opp video i HD. Men selv om mobiltelefoner er pakket full av ny teknologi, er det ikke alt som beveger seg like fort der i gården. Lyden har vært den samme i svært mange år. Og det hjelper bare litt hva mobilprodusenten gjør. Det er hvordan lyden fanges opp, kodes, sendes, dekodes og presenteres for mottakeren som er avgjørende for kvaliteten.

Lavdefinisjon

Selv om mobillyd er blitt litt bedre med årene, kan den ikke kalles høydefinert. På nettet, derimot, er lyden en helt annen. Med IP-telefoni slik som Skype får man et frekvensområde som gjør samtaleopplevelsen mye bedre. Det samme kan sies om lyden på videokonferanser. Så hvorfor er lyden på mobiltelefonen så dårlig?

For å forstå det må vi tilbake til den gangen digital mobiltelefoni ble standardisert gjennom GSM i 1991. Man ønsket å beholde frekvensområdet for tale som ble brukt i analog telefoni og som var begrenset til 300 til 3.400 Hz. Dette er de viktigste frekvensene som bærer stemme. Dessuten gjaldt det å begrense bruken av ressursene den enkelte samtale opptok. Kapasiteten til hver enkelt basestasjon skulle rekke til fleste mulig brukere. Det var gjort enorme investeringer i mobilnettene og operatørene ønsket å få mest mulig igjen før de investerte mer. Med en slik begrensing i frekvensområdet kan det av og til være vanskelig å høre tydelig forskjell på høyfrekvente lyder som S og F.

Kodeker

Når stemmen skal overføres til en liten bitstrøm, må den først gjennom en såkalt A/D, en analog til digitalomvandler. Deretter sendes bitstrømmen inn i en kodek som enkelt kan beskrives som en algoritme som regner om bitene slik at de får riktig format. Det innebærer først og fremst en reduksjon i bits per sekund, men også innlegging av kode som kan gjenopprette feil hos mottaker og andre kvalitetsfremmende tiltak.

Slike kodeker har sin analogi i musikkverdenen, selv om CD-lyd er ukomprimert og har veldig høy bitrate. For at lyd skal få plass på minnekort og på nettet blir den bitredusert for eksempel med MP3 og senere AAC.

Full- og Halfrate

De første kodekene som kom i mobilnettet var Fullrate og Halfrate; FR og HR. Den første benyttet en bitrate på 13 kbit/s, mens den siste presset bitforbruket ned til 5,5 kbit/s. Det normale var at samtalen ble satt opp med fullrate, men når basestasjonen ble hardt belastet, slik som ved store arrangementer, ble brukerne flyttet over til halvrate.

I 1997 ble kodekene forbedret og man fikk Enhanced-versjon. Disse kodekene hadde høyere lydkvalitet til tross for en litt lavere bitrate. EFR brukte bare 12,2 kbit/s. Dessuten ble feilkorreksjonen bedre, slik at samtalen tålte lenger avstand til basestasjonen og mer forstyrrelser. Ulempen var en mer kompleks algoritme som faktisk økte strømforbruket et par prosent under en samtale.

AMR

I 1998 ble Adaptive Multi-Rate audio codec antatt som standard av 3GPP som har ansvar for slikt. I praksis var dette en videreføring av EFR, men med variabel bitrate i mange trinn. Fordelen var at den var enda mer robust og kunne holde samtalen gående under mer vanskelige forhold. Likevel tok det lang tid før kodekene ble tatt i bruk, og det var ikke før i 2006 at Netcom implementerte AMR.

Frem til i dag er rundt 97 prosent av alle samtaler satt opp med AMR. Alle samtaler på 3G bruker denne kodeken, og de aller fleste på GSM.

HD Voice

Den virkelig store revolusjonen blir HD Voice. Her er talekvaliteten så høy at mange vil sammenlikne det med at du er i samme rom som samtalepartneren. I noen tilfeller blir den faktisk bedre fordi denne kodeken vil kunne fjerne en del bakgrunnsstøy også.

Navnet HD Voice er egentlig bare en mer sexy betegnelse på en ikke helt ny teknologi som er videreføringen av AMR. Den kalles AMR-WB (Wide Band) som indikerer at den håndterer mye større båndbredde. Derfor omtales dagens versjon som AMR-NB (Narrow Band).

Mens vi tidligere har nøyd oss med lyden innen 300 til 3.400 Hz, utvides nå frekvensområdet til 50 til 7.000 Hz. Forskjellen er dramatisk.

Gammel teknologi

HD Voice er et godt eksempel på at ting tar tid. AMR-WB ble tatt inn som en standard i 3GPP for elleve-tolv år siden. De første forsøkene i nettverkene ble gjort av T-mobile i 2006, mens Orange har ledet an i utrullingen i svært mange av sine nett.

Dobbelt antall lydprøver

I dagens mobiler brukes en såkalt samplingsfrekvens på 8 kHz. Det vil si at det tas 8.000 lydprøver i sekundet. Med HD Voice dobles dette til 16 kHz. Algoritmen for talekoding er blitt bedre, men også mer regnekraftkrevende. Det betyr at det trengs kraftigere prosessering for å kode. Når den er kodet trengs det en bitrate på 12,65 kbit/s til overføring. Det er bare ørlite mer enn AMR-NB. Hvis det oppstår situasjoner med mye bakgrunnsstøy, vil bitraten øke. Bitraten kan også falle ned til 8,85 eller 6,6 kbit/s hvis kapasitetshensyn krever det, men da vil talekvaliten gå litt ned.

Det er også definert inn høyere bitrater i flere trinn helt opp til 23,85 kbit/s som kan brukes når kodeken benyttes til å filtrere ut masse bakgrunnsstøy.

Transkoding

Det skjer det en masse såkalt transkoding i mobilnettet. Det vil si at talen overføres fra et digitalt format til et annet. Når en samtale overføres, blir den sendt fra mobilen over radionettet med en bitrate på 12,2 kbit/s. I basestasjonen blir den kodet om til standardformatet for samtaler som overføres i fastnettet på 64 kbit/s. Hvis det er mobiler i begge ender, kodes den tilbake til 12,2 kbit/s i basestasjonen samtalemottakeren er koblet.

Enhver transkoding representerer en kvalitetsreduksjon. Med HD Voice overføres bitstrømmen akkurat slik den forlater mobiltelefonen, og blir ikke transkodet hvis samtalen foregår mellom to telefoner som kan dekode AMR-WB. Hvis samtalen går til en eldre mobiltelefon eller en fasttelefon, blir den transkodet og tilpasset de to terminaltypene.

Kilder: Produktsjef for mobildata i Netcom, Roy Nilssen og teknologisjef i Ericsson, Stian Solberg.

Til toppen