Ergebnis 1 bis 12 von 12

Thema: Bsp.: Radio abhören und bei gewissen Worten eine Aktion auslösen

  1. #1
    Avatar von syrius
    Registriert
    Mar 2015
    Beiträge
    2,124
    Gefällt mir!
    1,233
    Du gefällst: 2,816

    Bsp.: Radio abhören und bei gewissen Worten eine Aktion auslösen

    Hallo zusammen,

    mir ist vorhin eine Idee gekommen. Ich möchte gern einen Radio-Stream abhören und bei gewissen Worten, die der Moderator von sich gibt, eine Aktion auslösen.

    Hat da jemand Ansätze wie das zu realisieren wäre?

    Gruß
    Syrius
    SzeneBox.org bei Telegram https://t.me/szenebox

  2. Werbung - Hier werben?
  3. #2
    Senior
    Registriert
    Jul 2016
    Beiträge
    335
    Gefällt mir!
    83
    Du gefällst: 397
    Hi Syrius,

    ich denke aber das das ein zu komplexes Thema ist um so etwas privat umzusetzten, ich habe allerdings auch keine Ahnung von dieser Thematik. Trotzdem mal ein paar Gedanken die mir zu dem Thema auf die Schnelle gekommen sind:
    Allein wenn ich daran denke wie das mit Android funktioniert, habe ich den Eindruck das es mit großem Rechenaufwand verbunden ist.
    Man muss zuerst das Handy trainieren damit es den Aufruf verstehr, beispielsweise mehrmals sein Ok Google sagen damit es das mit deiner Aussprache und Stimme erkennen kann. Mit völlig unbekannten Stimmen/Sprachweisen ist das sicher Schwieriger. Der Rest der Befehle wird dann zuerst an Server gesendet und dort ausgewertet.
    Auf der anderen Seite gibt es seit vielen Jahren die Spracherkennungsprogramme, die immer genauer werden.

    Vom Prinzip her müsstest du wohl den kompletten Radiotext aufnehmen und jedes Wort (erkennbar an kurzen Sprechlücken) mit mehreren, verschieden schnell und deutlich gesprochenen, abgespeicherten Tonfolge vergleichen, wobei da eine grössere Toleranz als Abweichung erlaubt sein müsste.

    Ich vermute einfach mal das du als Reaktion etwas aufnehmen möchtest. Dann wäre das nächste Problem, wo ist das Ende der Aufnahme ? Es sagt ja keiner "Ende"

  4. #3
    THEMENSTARTER

    Avatar von syrius
    Registriert
    Mar 2015
    Beiträge
    2,124
    Gefällt mir!
    1,233
    Du gefällst: 2,816
    Ja, die Vermutung lag nahe, dass das nichts einfaches wird. Es geht im Detail darum, dass wenn jemand bei einem Gewinnspiel im Radio teilnimmt, und der Moderator den Namen des Gewinners aufruft, eine Nachricht per Telegram getriggert wird, was den Teilnehmer wiederum triggert anzurufen, um den Gewinn zu erhalten.

    Such mir auch schon einen Wolf aber was brauchbares ohne weiter Cash zu investieren... bisher nichts gefunden.
    SzeneBox.org bei Telegram https://t.me/szenebox

  5. #4
    Senior
    Registriert
    Jul 2016
    Beiträge
    335
    Gefällt mir!
    83
    Du gefällst: 397
    Es geht also um einen ganz speziellen und immer denselben Namen, was von Vorteil ist. Denn bei allgemein Namen ist ein Doppelname wie Marius Meyer-Bender sicher wohl schwerer als Name zu erkennen, weil der aus drei Wörtern besteht.
    Was zum nächsten Problem führt, es sollte sowohl Marius Bender als auch nur Bender erkannt werden. Marius Bender deswegen, weil dann die Treffsicherheit besser gegeben ist, als wie einfach bei Bender, wo vielleicht Länder oder ähnliche Wörter einen Fehlalarm auslösten könnten.
    Ein noch grösseres Problem wäre, wenn der zu überwachende Name Wiese, Lukas, oder sonst ein Name wäre, der auch im normalen Sprachgebrauch öfters vorkommt. Deswegen möglichst mit Vornamen.

    Wie geschrieben, ich sehe nur die Möglichkeit kommplett alles Live aufzunehmen, im Speicher/Ramdisk jedes einzelne Wort abzugleichen und sofort wieder zu löschen wenn es nicht zutrifft. Was natürlich auch aufwendig ist und eines erst zu bekommenden Algorhytmus bedarf.
    Ob es kostenlose Pragramme zu dem Thema gibt, glaube ich weniger. Und wenn dann nur um diesen Text in einer Datei weiterzuverarbeiten, nicht um eine Reaktion auszulösen. Ich hatte mal kurz gegoogelt, es gibt viel theoretische Abwandlungen dazu, aber in der Praxis habe ich auf die Schnelle nichts hilfreiches gefunden.

    Wir haben eine tolle Community hier, vielleicht fällt jemanden wirklich noch etwas brauchbares ein.

  6. #5
    Better with Bacon Avatar von Trisumat
    Registriert
    Mar 2015
    Alter
    47
    Beiträge
    185
    Gefällt mir!
    205
    Du gefällst: 159
    Kann man nicht evtl Amazon Alexa oder Google Home dazu kriegen bei dem richtigen "Codewort" eine dementsprechende Routine zu starten?
    So nach dem Motto: Alex (umbenennen) hört den entsprechenden Vornamen (das Trigger Wort) und wird aktiv, direkt danach erkennt sie ja dann hoffentlich den Nachnamen, der dazu benutzt wird die dementsprechende Routine zu starten.

    Kein plan ob das überhaupt geht und wenn, ob es auch sauber erkannt wird.
    Was ist rot und stört beim Kauen ?
    Ein Backstein

  7. Diesen Mitgliedern gefällt dieser Beitrag:


  8. #6
    Senior
    Registriert
    Apr 2017
    Beiträge
    229
    Gefällt mir!
    124
    Du gefällst: 115
    https://marc.w.erfel.de/2015/09/30/n...s-funkscanner/

    vielleicht hilft sowas in die richtung, dort wird auch über ähnliches geschrieben.

  9. #7
    Junior
    Registriert
    Nov 2019
    Beiträge
    72
    Gefällt mir!
    116
    Du gefällst: 17
    Google & Microsoft bieten Deep Lerning APIs an / KI und sowas ...

    Das gibt es auch für Audio Streams

    https://cloud.google.com/speech-to-text/

    Damit bekommst du zb aus dem gesprochenen text. Im Text kannst du dann halt nach Namen suchen.

  10. #8
    Senior
    Registriert
    Jan 2018
    Beiträge
    308
    Gefällt mir!
    170
    Du gefällst: 131
    also generell gibt es mehrere probleme
    das signal könnte mit störungen ankommen und somit ist die signalverarbeitung erschwert, da du von stream redest, hörst du das ganze wohl per internet ab, also ist das problem schonmal minimiert

    dann gibt es das problem das der moderator nicht unbedingt den richtigen namen sagen könnte bspw. michi das michael

    ich habe vor einem jahr mal probiert eine sprachsteuerung für eine app umzusetzten und hier mal ein paar sachen die ich da so mitgenommen habe
    selbst bei perfekten audio signalen / aussprachen gibt (bzw. gab es zu dem zeitpunkt) keine api die freizugänglich ist die 100% der worte erkannt hat
    ich suche gleich mal kurz ob ich meine alte dokumentation zu dem ganzen finde, weil ich dort ein paar services vergliechen habe ich weiß nurnoch das ich am ende https://wit.ai/ verwendet habe

    es gibt jedoch nicht nur cloud-lösungen es gibt auch noch offline lösungen wir CMU Sphinx, hier musst du jedoch dein eigenes modell erzeugen

    sonstiges: https://de.wikipedia.org/wiki/Soundex
    https://en.wikipedia.org/wiki/Levenshtein_distance

    edit:/
    anscheint hatten ein paar Services bei dem Testsatz doch 100% erkannt, aber bei echten Aufnahmen sah das Ganze etwas anders aus.

    der test satz war:
    Influenza-A-Virus H1N1 bezeichnet einen Subtyp des Influenzavirus, der bei Enten, Menschen und Schweinen vorkommt, aber auch zahlreiche andere Säugetierarten sowie Truthähne infizieren kann

    Google-Speech-Recognition: 100% erkannt, Antwortzeit: schnell, Preis 1.44 USD /h
    Wit.ai (Facebook) 100% erkannt, Antwortzeit schnell, kostenlos
    Bing Speech Recognition: 1 Fehlerhaftes, ...
    Trint.com: 2 Fehlende, 1 Fehlerhaftes Wort
    CMUSphinx: 71% Fehlende Wörter

    Sonstige:
    Dragon NaturallySpeaking bietet keine API
    Voicebase Registration keine EMail erhalten
    Amazon Transcribe muss CC hinterlegt werden
    IBM (WATSON): kein Deutsch

  11. Diesen Mitgliedern gefällt dieser Beitrag:


  12. #9
    Senior
    Registriert
    Jul 2016
    Beiträge
    335
    Gefällt mir!
    83
    Du gefällst: 397
    Zitat Zitat von Trisumat Beitrag anzeigen
    So nach dem Motto: Alex (umbenennen) hört den entsprechenden Vornamen (das Trigger Wort) und wird aktiv, direkt danach erkennt sie ja dann hoffentlich den Nachnamen, der dazu benutzt wird die dementsprechende Routine zu starten.
    So wie ich das verstehe verwenden Alxa und Co ja einzig dieses eine Triggerwort, in deinem Beispiel den Vornamen. Dieses muss man ihnen aber auch erst durch mehrmaliges sprechen antrainieren. Das ist dann der Auslöser. Die nächsten Wörter bis zu einer grösseren Sprechpause, werden dann digitalisiert aufgenommen und and die Server zum auswerten versendet.

    Man müsste wohl tief in die Software eingreifen damit eine andere Aktion gestartet wird. Eben vielleicht - statt den Satz an die Server zu senden, ihn an einen Telegram-Bot schicken.
    Falls so etwas klappen würde, könnte man natürlich die Hardware dazu mitverwenden. Und müsste das radio dann vor die Alexa/Google Box stellen.

  13. #10
    Junior Avatar von 4nn8
    Registriert
    Apr 2018
    Beiträge
    63
    Gefällt mir!
    15
    Du gefällst: 89

  14. #11
    Anfänger
    Registriert
    Oct 2021
    Beiträge
    12
    Gefällt mir!
    1
    Du gefällst: 4
    warum so kompliziert? wandel die audiospur in waveform um und vergleich sie mit genau der waveform des wortes, das du raushören willst. ist keine 100%ige lösung aber gut genug sollte das doch schon funktionieren

  15. #12
    Anfänger Avatar von Arn0m
    Registriert
    Jun 2022
    Beiträge
    17
    Gefällt mir!
    24
    Du gefällst: 8
    Zitat Zitat von ffsayk Beitrag anzeigen
    warum so kompliziert? wandel die audiospur in waveform um und vergleich sie mit genau der waveform des wortes, das du raushören willst. ist keine 100%ige lösung aber gut genug sollte das doch schon funktionieren
    Wave she ich als kritisch an ... die waveform kann sich unterscheiden in Höhen und Tiefen je nach Stimme der Ansage.

    Fand da die Idee per Alexa besser ... man müsste doch einen hook erstellen können der auf den Namen XYZ die Aktion A1 Auslöst? mit etwas Knowhow sollte das per Custom Routine doch umsetzbar sein! Alexa hört doch eh alles mit

Ähnliche Themen

  1. Heimliches Abhören bei Smartphones trotz angeblich deaktiviertem Mikrofon
    Von Eisenbahn im Forum Technik / Hardware & Software
    Antworten: 4
    Letzter Beitrag: 28.03.2021, 14:04
  2. Darf eine deutsche .de Domain auf eine Erotikseite umleiten ?
    Von Guest im Forum Webmaster Daily Talk & OffTopic
    Antworten: 13
    Letzter Beitrag: 12.12.2018, 16:26
  3. Hacker können Anrufe und SMS im LTE-Netz abhören
    Von RedDevil im Forum Datenschutz & Privatsphäre (IT-Security)
    Antworten: 0
    Letzter Beitrag: 24.10.2016, 11:48
  4. USA will an Daten in Europa und sichert sich Amtshilfe beim Abhören
    Von RedDevil im Forum Datenschutz & Privatsphäre (IT-Security)
    Antworten: 1
    Letzter Beitrag: 17.07.2016, 11:59

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •  
SzeneBox.org... im Mittelpunkt der Szene!
© since 2015 szeneBOX.org - All Rights Reserved
Domains: www.szenebox.org