Სარჩევი:

ტრიგერის დაწყების ხმის დამატება Google AIY ხმის ნაკრებში: 6 ნაბიჯი (სურათებით)
ტრიგერის დაწყების ხმის დამატება Google AIY ხმის ნაკრებში: 6 ნაბიჯი (სურათებით)

ვიდეო: ტრიგერის დაწყების ხმის დამატება Google AIY ხმის ნაკრებში: 6 ნაბიჯი (სურათებით)

ვიდეო: ტრიგერის დაწყების ხმის დამატება Google AIY ხმის ნაკრებში: 6 ნაბიჯი (სურათებით)
ვიდეო: Headaches & Migraines in POTS - Melissa Cortez, DO 2024, ნოემბერი
Anonim
Image
Image
ნაბიჯი 2: შეამოწმეთ Voicehat.py ფაილი დამატებითი ინფორმაციისთვის
ნაბიჯი 2: შეამოწმეთ Voicehat.py ფაილი დამატებითი ინფორმაციისთვის

ეს გაკვეთილი საკმაოდ მარტივია. მე ნამდვილად მსიამოვნებდა Google AIY ხმის ნაკრები, მაგრამ მე ნამდვილად მომწონს ჩემს ჩვეულებრივ Google Home– ში ის ხმაური, რასაც ისინი ადასტურებენ იმის დასამტკიცებლად, რომ ისინი აქტიურად უსმენენ. ეს არ არის დაყენებული ნაგულისხმევად ნებისმიერ მაგალითში, რომელიც წინასწარ არის ჩატვირთული AIY Voice Kit სურათზე.

მე ასევე ვამატებ ბმულს საფონდო ხმების დაწყებისა და დადასტურების შესახებ, რომლებიც ჩამწერია ჩემი რეალური Google Home– დან ჩემი Zoom ჩამწერით.

აქ ჩვენ მივდივართ-ჩემი პირველი ინსტრუქცია!

ნაბიჯი 1: საჭირო მასალები და ფაილები

  1. სრულად ფუნქციონალური Google AIY ხმის ნაკრები-თქვენი ნაკრების დასაყენებლად ეწვიეთ AIY ხმის ნაკრების ოფიციალურ გვერდს.
  2. თქვენი Pi ტერმინალზე წვდომის შესაძლებლობა SSH, VNC, ან მონიტორის და კლავიატურის საშუალებით
  3. . Wav ფაილი, რომლის დაკვრაც გსურთ, როდესაც Pi უსმენს ხმოვან შეყვანას-თუ არ იყენებთ პერსონალურ ფაილს, გადმოწერეთ სტანდარტული "St art Talking" ფაილი აქ ან გადმოწერეთ თანდართული ბმულიდან.
  4. (სურვილისამებრ) აუდიო რედაქტორი, რომელსაც შეუძლია ფაილების გარდაქმნა და მათი ბიტის და ნიმუშის სიხშირის შეცვლა

ნაბიჯი 2: ნაბიჯი 2: შეამოწმეთ Voicehat.py ფაილი დამატებითი ინფორმაციისთვის

ᲛᲜᲘᲨᲕᲜᲔᲚᲝᲕᲐᲜᲘ

მე არ ვიყენებ უახლეს სურათს ჩემს ხმის ნაკრებში, რომელიც შეიცავს კოდს როგორც ხმის, ისე ხედვის ნაკრებისთვის (ანუ aiyprojects-2018-01-03.img). მე ვიყენებ Voice Kit– ის ფილიალის კოდს, რომელიც შეგიძლიათ ნახოთ Google AIY Raspbian GitHub– ში. ჩემი პირადი აზრი არის ის, რომ გამოიყენოთ Voice Kit– ის ფილიალი მისი სიმარტივისთვის და არ დაგჭირდეთ ხედვის კოდთან გამკლავება, როდესაც მუშაობთ თქვენს ხმის ნაკრებთან

გადადის…

ეს ნაბიჯი სულაც არ არის სავალდებულო, მაგრამ ის გაჩვენებთ, თუ სად არის Google– ში ჩაფლული ინსტრუქცია ამ სამუშაოს შესრულების შესახებ, თუ გინდათ რომ ეს კიდევ უფრო წინ გადადგათ ან გაიგოთ რატომ მუშაობს კოდი, რომელსაც მე ვამატებ.

pi@ჟოლო: cd AIY-voice-kit-python/src/aiy/

შემდეგ ჩვენ ვაპირებთ შეამოწმოთ voicehat.py ფაილი ამ საქაღალდეში:

pi@ჟოლო: ~/AIY-voice-kit-python/src/aiy/sudo nano voicehat.py

თანდართული სურათი გვიჩვენებს, თუ სად შეგიძლიათ გაიგოთ სტატუსის ინტერფეისის შესახებ და როგორ გამოიყენოთ ხმა ტრიგერის დროს.

კარგი, ახლა მოდით დავამატოთ კოდი ერთ – ერთ მაგალით ფაილს, რომ ეს საქმე იმუშაოს.

ნაბიჯი 3: ნაბიჯი 3: დაამატეთ ტრიგერის ხმის კოდი დემო კოდს

ნაბიჯი 3: დაამატეთ გამომწვევი ხმის კოდი დემო კოდს
ნაბიჯი 3: დაამატეთ გამომწვევი ხმის კოდი დემო კოდს

პირველი, გადადით AIY-voice-kit-python საქაღალდეში და გაუშვით წყაროს კოდი

cd AIY-voice-kit-python

წყარო env/bin/გააქტიურება

cd src

შემდეგ გამოიყენეთ 'sudo nano' ან 'assist_grpc_demo.py' ან 'ასისტენტ_ლიბერალური_დემო.პი'

ამ ორ ფაილს შორის განსხვავება იმაში მდგომარეობს იმაში, რომ ასისტენტი_გრპც_დემო.პაი იყენებს ღილაკს Google ასისტენტის გასააქტიურებლად და ასისტენტი_ლიბერალური_დემო.პი იყენებს აქტივაციის სიტყვას "კარგი, Google", რათა გამოიწვიოს Google ასისტენტი.

ორივე ამ ფაილისთვის საჭიროა მხოლოდ ერთი ხაზის კოდის დამატება:

status_ui.set_trigger_sound_wave ('/home/pi/googlestart.wav')

ეს ნიშნავს, რომ თქვენ განათავსეთ თქვენი საწყისი ხმა/home/pi/საქაღალდეში და დაარქვით googlestart.wav. შეცვალეთ ისინი იმისდა მიხედვით, თუ რა დაარქვით თქვენს ფაილს და სადაც არ უნდა იყოთ იგი.

კოდის ხაზი, რომელსაც ჩვენ ვეძებთ არის ქვემოთ:

status_ui.status ('მოსმენა')

ჩვენ გვსურს დავამატოთ ჩვენი ახალი კოდის ხაზი კოდის ამ ხაზის წინ…

'ასისტენტ_ლიბერალური_დემო.პის' მაგალითისთვის შეგიძლიათ იხილოთ აქ:

elif event.type == EventType. ON_CONVERSATION_TURN_STARTED:

# და ახლა დაამატეთ ჩვენი კოდი status_ui.set_trigger_sound_wave ('home/pi/googlestart.wav') status_ui.status ('მოსმენა')

"ასისტენტ_გრპც_დემო.პის" მაგალითისთვის შეგიძლიათ იხილოთ აქ:

button.wait_for_press ()

# და ახლა დაამატეთ ჩვენი კოდი status_ui.set_trigger_sound_wave ('/home/pi/googlestart.wav') status_ui.status ('მოსმენა')

ეს ნიშნავს, რომ თქვენ განათავსეთ თქვენი საწყისი ხმა/home/pi/საქაღალდეში და დაარქვით googlestart.wav. შეცვალეთ ისინი იმისდა მიხედვით, თუ რა დაარქვით თქვენს ფაილს და სადაც არ უნდა იყოთ იგი.

დააჭირეთ CTRL-X & Y ყველაფრის შესანახად.

*** შენიშვნა: მე ვიპოვე რაღაც სულელური. "ასისტენტ_ლიბერალურ_დემო.პისთვის" ტრიგერის ხმის დამატება, როგორც ჩანს, არანაირ განსხვავებას არ ახდენს მეტყველების ამოცნობის ფუნქციაში. თუმცა, 'ასისტენტ_გრპკ_დემო.პის'თვის, როგორც ჩანს, როდესაც ტრიგერის ხმა ამოქმედდება, ის წყვეტს თქვენს მიერ ნათქვამ პირველ ან ორ სიტყვას. მთლად დარწმუნებული არ არის რატომ. მაინც ცდილობს ამის გარკვევას.

ნაბიჯი 4: ნაბიჯი 4: გაუშვით კოდი და დარწმუნდით, რომ ყველაფერი კარგადაა

pi@ჟოლო: cd AIY-voice-kit-python

და ჩატვირთეთ ვირტუალენვი

pi@ჟოლო: ~/AIY-voice-kit-python $ source env/bin/activ

და გაუშვით!

(env) pi@ჟოლო: ~/AIY-voice-kit-python $ src/assist_library_demo.py

ან

(env) pi@ჟოლო: ~/AIY-voice-kit-python $ src/assist_grpc_demo.py

ახლა თქვით "კარგი, Google" ან დააჭირეთ ამ ღილაკს და ნახეთ მუშაობს თუ არა!

მომდევნო გვერდი დაგეხმარებათ, თუ გაქვთ საკუთარი პერსონალური ფაილი და შესაბამისი ბიტი და ნიმუშის განაკვეთები თქვენი.wav ფაილისთვის

ნაბიჯი 5: ნაბიჯი 5: შექმენით თქვენი საკუთარი.wav ფაილი

ნაბიჯი 5: შექმენით თქვენი საკუთარი.wav ფაილი
ნაბიჯი 5: შექმენით თქვენი საკუთარი.wav ფაილი

თუ არ ხართ დაინტერესებული Google Home– ის სტანდარტული დაწყების ჩემი.wav ფაილის გამოყენებით, თქვენ უნდა შექმნათ თქვენი საკუთარი.wav ფაილი. ცოტაოდენი ცდა და შეცდომა დასჭირდა იმისთვის, რომ გამეკეთებინა სწორი ბიტი და ნიმუშის განაკვეთი ჩემზე.

მე გამოვიყენე Logic Pro X მთელი ჩემი რედაქტირებისთვის (სურათზე), რომელიც არის სრულფასოვანი DAW მუსიკის შესაქმნელად და წარმოებისთვის. ორი ვარიანტი, რაც მე აღმოვაჩინე, რომელიც შეიძლება შესაფერისი იყოს არის Switch ან MediaHuman Audio Converter. მე ვივარაუდებ, რომ ამის გაკეთება გარაგებანდით შეგიძლიათ, თუ Mac გაქვთ, მაგრამ მე ეს არ გამომიცდია.

თქვენი ფაილის სამი ძირითადი ნაწილია საჭირო დემო კოდთან მუშაობისთვის.

  1. უნდა იყოს MONO აუდიო ფაილი
  2. ნიმუშის განაკვეთი უნდა იყოს 32000
  3. უნდა იყოს.wav ფაილი
  4. (სურვილისამებრ) 16 ბიტიანი რეზოლუცია საუკეთესოდ მუშაობდა ჩემთვის

ნაბიჯი 6: ნაბიჯი 6: დასტური ხმის დამატება?

ეს ის ადგილია, სადაც ვინმეს რაიმე აზრი აქვს. მე სიამოვნებით დავამატებ დადასტურების ხმაურს, თუ სისტემა ამოიცნობს ხმოვან შეყვანას, როგორც ჩვეულებრივ Google Home– ში.

მე დავამატე საფონდო დადასტურების ხმაური ქვემოთ თქვენი მოხერხებულობისთვის.

ისიამოვნეთ!

გირჩევთ: