AI

ChatGPT teraz potrafi widzieć, słyszeć i mówić.

Na skróty

ChatGPT teraz potrafi widzieć, słyszeć i mówić. W ciągu najbliższych dwóch tygodni użytkownicy Plus będą mogli prowadzić rozmowy głosowe z ChatGPT (na iOS i Android) oraz dołączać obrazy do rozmów (na wszystkich platformach).

Możesz używać swojego głosu, aby prowadzić rozmowę z ChatGPT. Rozmawiaj z nim w drodze, poproś o opowieść na dobranoc lub rozstrzygnij debatę przy stole obiadowym.

Pokaż ChatGPT jedno lub więcej zdjęć. Znajdź przyczynę, dlaczego twój grill nie chce się zapalić, przeszukaj zawartość swojej lodówki, planując posiłek, lub przeanalizuj skomplikowany wykres w celu uzyskania danych związanych z pracą. Więcej informacji można znaleźć na stronie: https://openai.com/blog/chatgpt-can-now-see-hear-and-speak.

 

OpenAI wprowadza nowe funkcje głosowe i obrazowe do ChatGPT, oferując bardziej intuicyjny interfejs, który pozwala użytkownikom prowadzić rozmowy głosowe lub pokazywać ChatGPT, o czym mówią. Dzięki tym nowym funkcjom, użytkownicy mogą robić zdjęcia ciekawych miejsc podczas podróży i prowadzić na ich temat rozmowy na żywo. Mogą również robić zdjęcia zawartości swojej lodówki, aby dowiedzieć się, co przygotować na kolację, a po kolacji pomóc swojemu dziecku w rozwiązaniu problemu matematycznego, robiąc zdjęcie i zaznaczając problem.

W ciągu najbliższych dwóch tygodni funkcje głosowe i obrazowe będą dostępne dla użytkowników Plus i Enterprise. Funkcja głosowa będzie dostępna na iOS i Android, natomiast funkcja obrazowa na wszystkich platformach.

Nowa funkcja głosowa korzysta z nowego modelu tekstowo-mowy, który potrafi generować dźwięk przypominający ludzki głos. OpenAI współpracowało z profesjonalnymi aktorami głosowymi, aby stworzyć różne głosy. Do transkrypcji mowy na tekst wykorzystywany jest system rozpoznawania mowy Whisper.

Użytkownicy mogą teraz pokazywać ChatGPT jedno lub więcej zdjęć, aby rozwiązywać różne problemy, planować posiłki czy analizować skomplikowane wykresy. Rozumienie obrazów jest napędzane przez modele GPT-3.5 i GPT-4.

OpenAI stopniowo wdraża te nowe funkcje, dbając o bezpieczeństwo i korzyści. Nowe technologie głosowe i wizyjne otwierają wiele możliwości, ale niosą ze sobą również pewne ryzyko. Dlatego OpenAI wprowadza je ostrożnie, testując i udoskonalając je w odpowiedzi na feedback użytkowników.

Użytkownicy Plus i Enterprise będą mieli dostęp do tych nowych funkcji w ciągu najbliższych dwóch tygodni, a wkrótce potem zostaną one udostępnione również innym grupom użytkowników.

Podobne

  • Google Bard w Polsce

    Na skróty Bard jest dostępny w nowych miejscach i językach. Bard jest teraz dostępny w ponad 40 nowych językach, w tym arabskim, chińskim (uproszczonym/tradycyjnym), niemieckim, hindi, hiszpańskim i innych. Rozszerzyliśmy również dostęp do większej liczby miejsc, w tym wszystkich 27 krajów Unii Europejskiej (UE) i Brazylii. Bard jest globalny i ma na celu pomóc w…

  • Agent Skills nowy sposób interakcji z agentami AI

    Na skróty Umiejętności Agentów: Nowy wymiar interakcji z AI Dlaczego Umiejętności są potrzebne? Jak działają Umiejętności? Gotowe i niestandardowe Umiejętności Bezpieczeństwo i ograniczenia Źródła Umiejętności Agentów: Nowy wymiar interakcji z AI Sztuczna inteligencja, a w szczególności modele językowe takie jak Claude, rewolucjonizują sposób, w jaki pracujemy z informacją i wykonujemy złożone zadania. Firma Anthropic, twórca…

  • Wrześniowa aktualizacja Barda

    Na skróty Przedstawiamy najbardziej zaawansowany model Bard Co: Wasze opinie przyspieszyły zdolność Bard do bycia bardziej intuicyjnym, pomysłowym i responsywnym niż kiedykolwiek wcześniej. Niezależnie od tego, czy chcesz współpracować nad czymś zabawnym i kreatywnym, zacząć w jednym języku i kontynuować w ponad 40 innych językach, poprosić o dogłębną pomoc w kodowaniu lub poznać nowe tematy…

  • Zmiany w BingChat

    Na skróty Dzisiaj Bing udostępnia Chat dla wszystkich na całym świecie! Przechodzi z “limited Preview” do “Open Preview”. Ogłaszają także kilka nowych ulepszeń… * Historia czatu. Będzie można kontynuować rozmowy oraz utrzymać istniejące konwersacje w pasku bocznym przeglądarki Edge po kliknięciu linku. * Możliwość eksportowania i udostępniania rozmów z czatu. * Otwarcie platformy dla programistów,…

  • Słownik pojęć AI

    Na skróty Activation Function (Funkcja aktywacji): Funkcja aktywacji to funkcja matematyczna stosowana w sieciach neuronowych, która decyduje, czy neuron ma zostać aktywowany, czyli przekazać sygnał dalej. Funkcje aktywacji wpływają na zdolność sieci do uczestnictwa w nieliniowych związkach. Funkcja aktywacji to sposób, w jaki maszyny decydują, czy neuron ma przekazać sygnał dalej w sieci neuronowej. Active…

  • ChatGPT Code Interpreter

    Na skróty Nowy ChatGPT Code Interpreter: Oto 10 przykładów, które potrafi: Podstawowa edycja wideo w ChatGPT. Na przykład używanie poleceń tekstowych do szybkiego konwertowania pliku GIF na wideo. Segmentacja rynków muzycznych na podstawie arkusza kalkulacyjnego oraz tworzenie strategii biznesowych dla każdego z segmentów. Analiza i podsumowanie Twojego gustu muzycznego na podstawie playlist z Spotify. Tworzenie…