VoiceRecognition

java.lang.Object

com.reign.kat.lib.voice.receive.VoiceRecognition

All Implemented Interfaces:: IAudioRecvListener

public class VoiceRecognition extends Object implements IAudioRecvListener

Field Summary

Fields

Modifier and Type

Field

Description

static org.vosk.Model

model
Constructor Summary

Constructors

Constructor

Description

VoiceRecognition()
Method Summary

Modifier and Type

Method

Description

static void

init()

static VoiceRecognition

instance()

static boolean

isModelReady()

void

onUserFinishedSpeaking(net.dv8tion.jda.api.entities.Member member, AudioUser data)

static byte[]

transcode(byte[] origData)

Converts audio data from Discord's format (48Khz, 16-Bit Big-endian Stereo) to a format that VOSK needs (16Khz 16-Bit Little-endian Mono).

static String

wakeWordUttered(String speech)

Methods inherited from class java.lang.Object
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait

Field Details
- model
  
  public static org.vosk.Model model
Constructor Details
- VoiceRecognition
  
  public VoiceRecognition()
Method Details
- instance
  
  public static VoiceRecognition instance()
- init
  
  public static void init()
- isModelReady
  
  public static boolean isModelReady()
- onUserFinishedSpeaking
  
  public void onUserFinishedSpeaking(net.dv8tion.jda.api.entities.Member member, AudioUser data)
  
  Specified by:
  
  onUserFinishedSpeaking in interface IAudioRecvListener
- wakeWordUttered
  
  public static String wakeWordUttered(String speech)
- transcode
  
  public static byte[] transcode(byte[] origData)
  
  Converts audio data from Discord's format (48Khz, 16-Bit Big-endian Stereo) to a format that VOSK needs (16Khz 16-Bit Little-endian Mono).
  
  Parameters:
  
  origData - audio PCM data to convert
  
  Returns:
  
  16Khz mono audio