2025 나의 경쟁력을 높여줄 릴레이 라이브🔥

Thumbnail
얼리버드 할인 중
NEW
개발 · 프로그래밍백엔드

나도! 스프링으로 인공지능을 할 수 있다(인프1탄)대시보드

23명이 수강하고 있어요.

24%

37,130원

49,500원
지식공유자: 박매일
총 68개 수업 (14시간 44분)
수강기한: 
무제한
수료증: 발급
난이도: 
입문
-
초급
-
중급이상
지식공유자 답변이 제공되는 강의입니다
폴더에 추가공유
  • Henu 프로필Henu
    2025-01-081483399

    안녕하세요. 해당 강의 커리큘럼이 추후 현업에서 많은 도움이 될 것 같아 학습해 볼까 합니다. 다만, OpenAI API를 사용하는데 있어서 LLM Model에 따라 비용이 별도로 발생하는지요? (OpenAI 등 타사 서비스에서 제공하는 API를 이용해 보는 것은 이번이 처음이라 질문 내용이 부족한점 양해바랍니다.)

    박매일
    박매일
    박매일
    2025-01-08390884

    OpenAI API 사용시 초기에 5$(오늘기준 7,278원) 정도 결제하시고 실습하시면 여러 Model사용시 문제 없이 본 과정을 수강하실 수 있을듯합니다.

  • 인프러너 프로필인프러너
    2025-01-081483214

    안녕하세요. 해당 강의가 혹시 음성 인식이 가능한 커리큘럼인가요? 내용을 보면 mp3 파일을 업로드 하면 텍스트로 뽑아서 처리하는 부분은 있는데 예를들어 스마트폰에서 음식사진 만들어줘 라고 이야기를 하면 그 음성을 인식해서 해당 결과를 보여줄 수 있는 부분이 가능한지 궁금합니다.

    박매일
    박매일
    박매일
    2025-01-08390878

    본강의 에서는 STT, TTS 기능을 실습으로 진행하는 예제입니다. STT는 파일을 음성파일을 업로드 해서 TEXT로 변환하는 실습인데 이부분을 음성을 인식해서 바로 결과를 보여주는 기능으로 구현하면 가능하겠습니다. 음성을 직접 LLM에 전달하는 것이 아니라 일단 음성을 서버로 전달(업로드)하고(녹음형태) 서버에서 LLM으로 전달하여 TEXT 변환후 해당 TEXT로 다른 작업이 가능할듯합니다. 다른 방법으로는 Web Speech API를 사용하면 사용자의 음성을 텍스트로 변환해서 서버로 전달후 LLM을 이용해서 다른 처리도 가능 하겠습니다. 위 기능은 추가 구현해서 넣어 두도록 하겠습니다.^^ -13_Web Speech와 OpenAI로 음성 기반 이미지 생성(추가) 목표: Web Speech API와 OpenAI를 이용한 사용자의 실시간 라이브 음성을 텍스트로 변환하여 LLM을 통한 이미지 생성을 학습합니다.

채널톡 아이콘