FMUSER Wirless Verzend video en audio eenvoudiger!

[e-mail beveiligd] WhatsApp + 8618078869184
Taal

    Audio basiskennis en coderingsprincipes

     

     1. Basisconcepten

     

    1) Bitsnelheid: geeft aan hoeveel bits per seconde de gecodeerde (gecomprimeerde) audiogegevens moeten worden weergegeven, en de eenheid is meestal kbps.

     

    2) Luidheid en intensiteit: de subjectieve kenmerken van een geluid. Loudness geeft aan hoe hard een geluid klinkt. De luidheid varieert voornamelijk met de intensiteit van het geluid, maar wordt ook beïnvloed door de frequentie. Over het algemeen zijn zuivere middenfrequentiegeluiden beter dan pure laagfrequente en hoogfrequente geluiden.

     

    3) Sampling en sampling rate: Sampling is het omzetten van een continu tijdsignaal in een discreet digitaal signaal. De bemonsteringssnelheid verwijst naar het aantal monsters dat per seconde wordt verzameld.

     

    Nyquist-bemonsteringswet: wanneer de bemonsteringssnelheid groter is dan of gelijk is aan 2 keer de hoogste frequentiecomponent van het continue signaal, kan het bemonsterde signaal worden gebruikt om het originele continue signaal perfect te reconstrueren.

     

    2. veelgebruikte audioformaten

     

    1) WAV-formaat is een door Microsoft ontwikkeld geluidsbestandsformaat, ook wel wave-geluidsbestand genoemd. Het is het vroegste digitale audioformaat, breed ondersteund door het Windows-platform en zijn toepassingen, en heeft een lage compressiesnelheid.

     

    2) MIDI is de afkorting van Musical Instrument Digital Interface, ook bekend als Musical Instrument Digital Interface, een uniforme internationale standaard voor digitale muziek/elektronische synthetische muziekinstrumenten. Het definieert de manier waarop computermuziekprogramma's, digitale synthesizers en andere elektronische apparaten muzieksignalen uitwisselen, en specificeert het datatransmissieprotocol tussen kabels en hardware en apparaten die elektronische muziekinstrumenten van verschillende fabrikanten met computers verbinden, en kan het geluid van meerdere muziekinstrumenten simuleren. instrumenten. Een MIDI-bestand is een bestand in het MIDI-formaat en sommige opdrachten worden opgeslagen in het MIDI-bestand. Stuur deze instructies naar de geluidskaart en de geluidskaart zal het geluid synthetiseren volgens de instructies.

     

    3) De volledige naam van MP3 is MPEG-1 Audio Layer 3, dat in 1992 werd opgenomen in de MPEG-specificatie. MP3 kan digitale audiobestanden comprimeren met een hoge geluidskwaliteit en een lage bemonsteringsfrequentie. De meest voorkomende toepassing.

     

    4) MP3Pro is ontwikkeld door Swedish Coding Technology Company, dat twee belangrijke technologieën bevat: de ene is de unieke decoderingstechnologie van Coding Technology Company, en de andere is de integratie van de MP3-octrooihouder, de Franse Thomson Multimedia Company en de Duitse Fraunhofer. Een gezamenlijk onderzochte decoderingstechnologie door de Kringvereniging. MP3Pro kan de originele geluidskwaliteit van MP3-muziek verbeteren zonder de bestandsgrootte fundamenteel te veranderen. Het kan de geluidskwaliteit vóór compressie in de grootste mate behouden, terwijl audiobestanden met een lagere bitsnelheid worden gecomprimeerd.

     

    5) MP3Pro is ontwikkeld door Swedish Coding Technology Company, dat twee belangrijke technologieën bevat: de ene is de unieke decoderingstechnologie van Coding Technology Company, en de andere is de integratie van de MP3-octrooihouder, de Franse Thomson Multimedia Company en de Duitse Fraunhofer. Een gezamenlijk onderzochte decoderingstechnologie door de Kringvereniging. MP3Pro kan de originele geluidskwaliteit van MP3-muziek verbeteren zonder de bestandsgrootte fundamenteel te veranderen. Het kan de geluidskwaliteit vóór compressie in de grootste mate behouden, terwijl audiobestanden met een lagere bitsnelheid worden gecomprimeerd.

     

    6) WMA (Windows Media Audio) is het meesterwerk van Microsoft op het gebied van internetaudio en video. Het WMA-formaat bereikt een hogere compressiegraad door het dataverkeer te verminderen maar de geluidskwaliteit te behouden. De compressiesnelheid kan over het algemeen 1:18 bereiken. Daarnaast kan WMA ook het auteursrecht beschermen door middel van DRM (Digital Rights Management).

     

    7) RealAudio is een bestandsformaat gelanceerd door Real Networks. Het grootste kenmerk is dat het audio-informatie in realtime kan verzenden, vooral wanneer de netwerksnelheid laag is, het nog steeds soepel gegevens kan verzenden, dus RealAudio is voornamelijk geschikt voor online afspelen via het netwerk. De huidige RealAudio-bestandsindelingen omvatten voornamelijk RA (RealAudio), RM (RealMedia, RealAudio G2), RMX (RealAudio Secured), enz. De overeenkomst tussen deze bestanden is dat de kwaliteit van het geluid verandert met het verschil in netwerkbandbreedte. Onder de veronderstelling dat de meeste mensen een vloeiend geluid horen, kunnen luisteraars met een grotere bandbreedte een betere geluidskwaliteit krijgen.

     

    8) Audible heeft vier verschillende formaten: Audible1, 2, 3, 4. De Audible.com-website verkoopt voornamelijk audioboeken op internet en biedt bescherming voor de goederen en bestanden die ze verkopen via een van de vier speciale audioformaten van Audible.com . Elk formaat houdt voornamelijk rekening met de audiobron en het gebruikte luisterapparaat. Formaten 1, 2 en 3 gebruiken verschillende niveaus van spraakcompressie, terwijl formaat 4 een lagere bemonsteringsfrequentie en dezelfde decoderingsmethode gebruikt als MP3. De resulterende stem is duidelijker en kan efficiënter van internet worden gedownload. Audible gebruikt hun eigen desktop-afspeeltool, Audible Manager. Met deze speler kunt u bestanden in Audible-indeling afspelen die zijn opgeslagen op een pc of zijn overgebracht naar een draagbare speler.

     

    9) AAC is eigenlijk een afkorting voor Advanced Audio Coding. AAC is een audioformaat dat gezamenlijk is ontwikkeld door Fraunhofer IIS-A, Dolby en AT&T. Het maakt deel uit van de MPEG-2-specificatie. Het algoritme dat door AAC wordt gebruikt, verschilt van dat van MP3. AAC combineert andere functies om de codeerefficiëntie te verbeteren. Het audio-algoritme van AAC overtreft veel eerdere compressie-algoritmen (zoals MP3, enz.) in compressiemogelijkheden. Het ondersteunt ook maximaal 48 audiotracks, 15 laagfrequente audiotracks, meer samplefrequenties en bitrates, meertalige compatibiliteit en een hogere decoderingsefficiëntie. Kortom, AAC kan een betere geluidskwaliteit bieden onder de veronderstelling dat het 30% kleiner is dan MP3-bestanden.

     

    10) Ogg Vorbis is een nieuw audiocompressieformaat, vergelijkbaar met bestaande muziekformaten zoals MP3. Maar één verschil is dat het volledig gratis, open en zonder patentbeperkingen is. Vorbis is de naam van dit audiocompressiemechanisme en Ogg is de naam van een project dat een volledig open multimediasysteem wil ontwerpen. VORBIS is ook compressie met verlies, maar het gebruikt meer geavanceerde akoestische modellen om verlies te verminderen. Daarom klinkt OGG gecodeerd met dezelfde bitsnelheid beter dan MP3.

     

    11) APE is een verliesvrij gecomprimeerd audioformaat, onder de veronderstelling dat de geluidskwaliteit niet wordt verminderd, de grootte wordt gecomprimeerd tot de helft van het traditionele WAV-bestand zonder verlies.

     

    12) FLAC is de afkorting van Free Lossless Audio Codec, een set bekende gratis audio lossless compressiecodes, die wordt gekenmerkt door lossless compressie.

     

    3. het basisprincipe van audiocodering:

     

    Spraakcodering is bedoeld om de kanaalbandbreedte die nodig is voor verzending te verminderen, terwijl de hoge kwaliteit van de ingevoerde spraak behouden blijft.

     

    Het doel van spraakcodering is om een ​​encoder met lage complexiteit te ontwerpen om gegevensoverdracht van hoge kwaliteit te bereiken met de laagst mogelijke bitsnelheid.

     

    1) Mute-drempelcurve: De drempel waarbij het menselijk oor alleen in een stille omgeving geluid op verschillende frequenties kan horen.

    2) Kritieke frequentieband

    Omdat het menselijk oor verschillende resoluties heeft voor verschillende frequenties, verdeelt MPEG1 / Audio het waarneembare frequentiebereik binnen 22 kHz in 23 ~ 26 kritische frequentiebanden volgens verschillende coderingslagen en verschillende bemonsteringsfrequenties. De volgende afbeelding geeft de middenfrequentie en bandbreedte van de ideale kritische frequentieband weer. Zoals te zien is in de figuur, heeft het menselijk oor een betere resolutie van lage frequenties

    3) Maskeereffect in het frequentiedomein: Een signaal met een grotere amplitude maskeert een signaal met een vergelijkbare frequentie en een kleinere amplitude, zoals weergegeven in de onderstaande afbeelding:

     

    4) Maskeereffect in het tijdsdomein: Als er in korte tijd twee geluiden verschijnen, zal het geluid met een hogere SPL (geluidsdrukniveau) het geluid met een kleinere SPL maskeren. Het tijdsdomein maskeereffect is verdeeld in voorwaartse maskering (pre-masking) en achterwaartse maskering (post-masking). De post-masking tijd zal langer zijn, ongeveer 10 keer die van pre-masking.

    Het maskeringseffect in het tijddomein helpt de pre-echo te elimineren.

     

    4. de basismethode voor codering

     

    1) Kwantiseerder en kwantiseerder

     

    Kwantisering en kwantisering: Kwantisering zet een continu signaal in discrete tijd om in een discreet signaal in discrete tijd. Gebruikelijke kwantisatoren zijn: uniforme kwantiseerder, logaritmische kwantiseerder en niet-uniforme kwantiseerder. Het doel dat met het kwantiseringsproces wordt nagestreefd, is om de kwantisatiefout te minimaliseren en de complexiteit van de kwantiseerder te minimaliseren (de twee zijn op zichzelf een tegenstrijdigheid).

     

    (A) Uniforme kwantiseerder: de eenvoudigste, de slechtste prestatie, alleen geschikt voor telefoonstem.

     

    (B) Logaritmische kwantiseerder: het is ingewikkelder dan uniforme kwantiseerder en gemakkelijk te implementeren, en de prestaties zijn beter dan uniforme kwantiseerder.

     

    (C) Niet-uniforme kwantisator: ontwerp de kwantiseerder volgens de distributie van het signaal. Gedetailleerde kwantificering wordt uitgevoerd waar het signaal dicht is, en grove kwantificering wordt uitgevoerd wanneer het signaal schaars is.

     

    2) Stem-encoder

     

    Er zijn drie soorten spraak-encoders: (a) Waveform-encoder; (b) vocoder; (c) Hybride encoder.

     

    De golfvorm-encoder beoogt het construeren van een analoge golfvorm inclusief het achtergrondruisblad. Het werkt op alle ingangssignalen en produceert hoogwaardige samples en verbruikt een hoge bitsnelheid. De vocoder zal de originele golfvorm niet regenereren. Deze set encoders extraheert een set parameters, die naar de ontvangende kant worden gestuurd om het spraakgeneratiemodel af te leiden. De spraakkwaliteit van de vocoder is niet goed genoeg. Hybride encoder, die de voordelen van golfvorm-encoder en sirene bevat.

     

    2.1 Golfvorm-encoder

     

    Het ontwerp van de golfvorm-encoder is vaak onafhankelijk van het signaal. Het is dus geschikt voor het coderen van verschillende signalen en beperkt zich niet tot spraak.

     

    1) Tijddomeincodering

     

    a) PCM: pulscodemodulatie, is de eenvoudigste coderingsmethode. Het is alleen de discretisering en kwantisering van het signaal, en logaritmisatie wordt vaak gebruikt.

     

    b) DPCM: differentiële pulscodemodulatie, die alleen het verschil tussen monsters codeert. De vorige een of meer steekproeven worden gebruikt om de huidige steekproefwaarde te voorspellen. Hoe meer steekproeven er worden gebruikt om voorspellingen te doen, hoe nauwkeuriger de voorspelde waarde. Het verschil tussen de werkelijke waarde en de voorspelde waarde wordt het residu genoemd, dat het object van codering is.

                       

     

    c) ADPCM: adaptieve differentiële pulscodemodulatie, adaptieve differentiële pulscode. Dat wil zeggen, op basis van DPCM worden de kwantisator en voorspeller op de juiste wijze aangepast aan de veranderingen van het signaal, zodat de voorspelde waarde dichter bij het echte signaal ligt, het residu kleiner is en de compressie-efficiëntie hoger is.

     

    (2) Codering van het frequentiedomein

     

    Codering van het frequentiedomein is om een ​​signaal op te splitsen in een reeks verschillende frequentie-elementen en onafhankelijke codering uit te voeren.

     

    a) Subbandcodering: Subbandcodering is de eenvoudigste coderingstechniek in het frequentiedomein. Het is een technologie die het originele signaal van het tijddomein naar het frequentiedomein transformeert, het vervolgens in verschillende subbanden verdeelt en er respectievelijk digitale codering op uitvoert. Het gebruikt een banddoorlaatfiltergroep (BPF) om het originele signaal in verschillende (bijvoorbeeld m) subbanden (ook wel subbanden genoemd) te verdelen. Geef elke subband door de modulatiekarakteristieken die equivalent zijn aan enkelzijbandamplitudemodulatie, verplaats elke subband naar frequentie bijna nul, passeer respectievelijk BPF (een totaal van m) en breng vervolgens elke subband over met een voorgeschreven snelheid ( Nyquist-snelheid) Het subband-uitvoersignaal wordt bemonsterd en de bemonsterde waarde wordt gewoonlijk digitaal gecodeerd en m digitale encoders worden ingesteld. Stuur elk digitaal gecodeerd signaal naar de multiplexer en voer tenslotte de subband gecodeerde datastroom uit.

     

    Voor verschillende subbanden kunnen verschillende kwantiseringsmethoden worden gebruikt en kunnen verschillende aantallen bits worden toegewezen aan de subbanden volgens het waarnemingsmodel van het menselijk oor.

     

    b) transformatiecodering: DCT-codering.

     

    5. Vocoder

     

    Kanaalvocoder: Gebruikt de ongevoeligheid van het menselijk oor voor fase.

     

    homomorfe vocoder: kan synthetische signalen effectief verwerken.

     

    Formant vocoder: De meeste informatie van het spraaksignaal bevindt zich op de positie en bandbreedte van de formant.

     

    lineaire voorspellende vocoder: de meest gebruikte vocoder.

     

    6. Hybride encoder:

     

    De golfvorm-encoder probeert de golfvorm van het gecodeerde signaal te behouden en kan spraak van hoge kwaliteit leveren met een gemiddelde bitsnelheid (32 kbps), maar kan niet worden toegepast op gelegenheden met een lage bitsnelheid. De vocoder probeert een signaal te genereren dat auditief vergelijkbaar is met het gecodeerde signaal, en kan verstaanbare spraak leveren met een lage bitsnelheid, maar de resulterende spraak klinkt onnatuurlijk. De hybride encoder combineert de voordelen van beide.

     

    RELP: Op basis van lineaire voorspelling wordt het residu gecodeerd. Het mechanisme is: verzend slechts een klein deel van de residuen, en reconstrueer alle residuen aan de ontvangende kant (kopieer de residuen van de basisband).

     

    MPC: meerpulscodering, die de correlatie van de residuen verwijdert, en wordt gebruikt om te compenseren voor de eenvoudige classificatie van stemmen door de vocoder in stemhebbend en niet-stemhebbend zonder de defecten van tussenliggende toestanden.

     

    CELP: codeboek opgewekte lineaire voorspelling, die gebruik maakt van voorspelling van het spraakkanaal en de cascade van toonhoogtevoorspeller om het oorspronkelijke signaal beter te benaderen.

     

    MBE: multiband-excitatie, het doel is om een ​​groot aantal CELP-berekeningen te vermijden, om een ​​hogere kwaliteit te verkrijgen dan de vocoder.

     

     

     

     

    Een lijst van alle Question

    Bijnaam

    E-mail

    Contact

    Onze andere producten:

    Professioneel FM-radiostationuitrustingspakket

     



     

    IPTV-oplossing voor hotels

     


      Voer een e-mailadres in om een ​​verrassing te ontvangen

      fmuser.org

      es.fmuser.org
      it.fmuser.org
      fr.fmuser.org
      de.fmuser.org
      af.fmuser.org -> Afrikaans
      sq.fmuser.org -> Albanees
      ar.fmuser.org -> Arabisch
      hy.fmuser.org -> Armenian
      az.fmuser.org -> Azerbeidzjaans
      eu.fmuser.org -> Baskisch
      be.fmuser.org -> Wit-Russisch
      bg.fmuser.org -> Bulgarian
      ca.fmuser.org -> Catalaans
      zh-CN.fmuser.org -> Chinees (vereenvoudigd)
      zh-TW.fmuser.org -> Chinees (traditioneel)
      hr.fmuser.org -> Kroatisch
      cs.fmuser.org -> Tsjechisch
      da.fmuser.org -> Deens
      nl.fmuser.org -> Nederlands
      et.fmuser.org -> Ests
      tl.fmuser.org -> Filipijns
      fi.fmuser.org -> Fins
      fr.fmuser.org -> Frans
      gl.fmuser.org -> Galicisch
      ka.fmuser.org -> Georgisch
      de.fmuser.org -> Duits
      el.fmuser.org -> Greek
      ht.fmuser.org -> Haïtiaans Creools
      iw.fmuser.org -> Hebreeuws
      hi.fmuser.org -> Hindi
      hu.fmuser.org -> Hungarian
      is.fmuser.org -> IJslands
      id.fmuser.org -> Indonesisch
      ga.fmuser.org -> Iers
      it.fmuser.org -> Italian
      ja.fmuser.org -> Japans
      ko.fmuser.org -> Koreaans
      lv.fmuser.org -> Lets
      lt.fmuser.org -> Lithuanian
      mk.fmuser.org -> Macedonisch
      ms.fmuser.org -> Maleis
      mt.fmuser.org -> Maltees
      no.fmuser.org -> Norwegian
      fa.fmuser.org -> Perzisch
      pl.fmuser.org -> Pools
      pt.fmuser.org -> Portugees
      ro.fmuser.org -> Roemeens
      ru.fmuser.org -> Russisch
      sr.fmuser.org -> Servisch
      sk.fmuser.org -> Slowaaks
      sl.fmuser.org -> Slovenian
      es.fmuser.org -> Spaans
      sw.fmuser.org -> Swahili
      sv.fmuser.org -> Zweeds
      th.fmuser.org -> Thai
      tr.fmuser.org -> Turks
      uk.fmuser.org -> Oekraïens
      ur.fmuser.org -> Urdu
      vi.fmuser.org -> Vietnamese
      cy.fmuser.org -> Welsh
      yi.fmuser.org -> Jiddisch

       
  •  

    FMUSER Wirless Verzend video en audio eenvoudiger!

  • Neem contact op

    Adres:
    No.305 Zaal HuiLan Gebouw No.273 Huanpu Road Guangzhou China 510620

    E-mail:
    [e-mail beveiligd]

    Telefoon / WhatApps:
    + 8618078869184

  • Categorieën

  • Nieuwsbrief

    EERSTE OF VOLLEDIGE NAAM

    E-mail

  • paypal oplossing  Western UnionBank of China
    E-mail:[e-mail beveiligd]   WhatsApp: +8618078869184 Skype: sky198710021 Praat met me
    Copyright 2006 2020-Powered By www.fmuser.org

    Ons Contacten