×
뎁스노트
로그인
홈
언어
프레임워크
개발도구
네크워크와 서버
데이터베이스
프로젝트 관리
데이터 사이언스
이야기
사진
모집 · 홍보
닥터핸의 블로그
닥터핸의 블로그
로그인
회원가입
글쓰기
글 올리기
개발 노트, 이야기를 작성해보세요.
질문하기
부담없이 무엇이든 질문하세요.
사진 올리기
사진을 올려보세요.
Javascript
Transformers.js - 웹 브라우저에서 최첨단 머신러닝 모델을 실행!
닥터핸
10일 전
팔로우
팔로잉
![Transformers.js 로고](https://huggingface.co/datasets/Xenova/transformers.js-docs/resolve/main/transformersjs-light.svg) Hugging Face는 최근 **Transformers.js v3.2.0**을 발표했습니다. ## Transformers.js란 무엇인가요? **Transformers.js**는 서버 없이 웹 브라우저에서 직접 최첨단 머신러닝 모델을 실행할 수 있는 JavaScript 라이브러리입니다. 이를 통해 웹 개발자들은 Python 환경 없이도 다양한 AI 모델을 웹 애플리케이션에 통합할 수 있습니다. ## v3.2.0의 새로운 기능 이번 버전에서는 다음과 같은 모델들이 추가되었습니다: ### Moonshine: 실시간 음성 인식 ![Moonshine 모델](https://huggingface.co/spaces/webml-community/moonshine-web/resolve/main/banner.png) **Moonshine**은 자원 제한적인 디바이스에서도 빠르고 정확한 자동 음성 인식을 제공하는 모델입니다. 이를 통해 실시간 자막 생성이나 음성 명령 인식과 같은 기능을 웹 브라우저에서 직접 구현할 수 있습니다. **예시 코드:** ```javascript import { pipeline } from '@huggingface/transformers'; const transcriber = await pipeline('automatic-speech-recognition', 'onnx-community/moonshine-tiny-ONNX'); const result = await transcriber('path_to_audio_file.wav'); console.log(result.text); ``` 위 코드에서는 pipeline 함수를 사용하여 음성 인식 파이프라인을 생성하고, moonshine-tiny-ONNX 모델을 활용하여 오디오 파일의 텍스트를 추출합니다. ### Phi-3.5 Vision: 다중 프레임 이미지 이해 및 추론 **Phi-3.5 Vision**은 연속된 이미지 프레임을 분석하여 복잡한 시각적 이해와 추론을 수행하는 모델입니다. 이를 통해 비디오 분석이나 이미지 시퀀스 처리와 같은 작업을 효율적으로 수행할 수 있습니다. **예시 코드:** ```javascript import { pipeline } from '@huggingface/transformers'; const visualReasoner = await pipeline('image-to-text', 'phi-3.5-vision'); const result = await visualReasoner(['frame1.png', 'frame2.png', 'frame3.png']); console.log(result); ``` 위 코드에서는 pipeline 함수를 사용하여 이미지에서 텍스트를 생성하는 파이프라인을 만들고, phi-3.5-vision 모델을 활용하여 연속된 이미지 프레임을 분석합니다. ## Phi-3.5 Vision: 다중 프레임 이미지 이해 및 추론 Phi-3.5 Vision은 연속된 이미지 프레임을 분석하여 복잡한 시각적 이해와 추론을 수행하는 모델입니다.
비디오 분석이나 이미지 시퀀스 처리에 유용합니다. ```javascript import { pipeline } from '@huggingface/transformers'; const visualReasoner = await pipeline('image-to-text', 'phi-3.5-vision'); const result = await visualReasoner(['frame1.png', 'frame2.png', 'frame3.png']); console.log(result); ``` 위 코드는 이미지 시퀀스를 분석하여 텍스트를 생성하는 방법을 보여줍니다.
phi-3.5-vision 모델은 이미지 데이터를 기반으로 한 뛰어난 추론 능력을 제공합니다. ### EXAONE: 영어와 한국어 텍스트 생성 **EXAONE**은 영어와 한국어 모두에서 고품질의 텍스트 생성을 지원하는 다국어 모델입니다. 이를 통해 다양한 언어 환경에서 자연스러운 텍스트 생성이 가능합니다. **예시 코드:** ```javascript import { pipeline } from '@huggingface/transformers'; const textGenerator = await pipeline('text-generation', 'exaone'); const result = await textGenerator('안녕하세요, 오늘 날씨는'); console.log(result); ``` 위 코드는 EXAONE 모델을 사용해 주어진 텍스트의 이어지는 내용을 생성하는 방법을 보여줍니다.
한국어와 영어를 지원하기 때문에 다국어 애플리케이션에서 유용하게 사용할 수 있습니다. ## 버그 수정 및 기타 개선 사항 이번 릴리스에서는 여러 버그 수정과 성능 개선이 이루어졌습니다. 자세한 내용은 [릴리스 노트](https://github.com/huggingface/transformers.js/releases/tag/3.2.0)를 참고하세요. --- **Transformers.js v3.2.0**은 웹 개발자들에게 강력한 AI 기능을 손쉽게 통합할 수 있는 도구를 제공합니다. 특히, 서버 없이 브라우저에서 직접 모델을 실행할 수 있어 웹 애플리케이션의 가능성을 크게 확장시킵니다. 새로운 모델들과 기능을 활용하여 더욱 혁신적인 웹 서비스를 개발해보시기 바랍니다. ## 출처 * [Transformers.js v3.2.0 릴리스 노트](https://github.com/huggingface/transformers.js/releases/tag/3.2.0)
transformers.js
음성인식
Moonshine
1
0
0
145
신고하기
사용자 차단하기
닥터핸
10일 전
팔로우
팔로잉
댓글
0
올리기
답변 작성
답변 모드로 쓰기
이미지 첨부
올리기
아직 댓글이 없습니다. 첫번째 댓글 작성자가 되어주세요 :)
1
0
0
신고하기
사용자 차단하기
아직 댓글이 없습니다. 첫번째 댓글 작성자가 되어주세요 :)