יצירת תוכן היא מתישה. הקלטת וידאו, עריכת פודקאסטים, ואז כתיבת בלוגים? זה כמו לרוץ שלושה מרתונים לפני ארוחת בוקר. אבל מה אם היה דרך לצמצם את עומס העבודה ב-90%?
ובכן, הכל התחיל עם בעיה אישית. אתה מבלה שעות רבות באופן דרסטי, מתכנן, מקליט ומעריך וידאו או פודקאסט. התוכן שלך מלא בתובנות ובערך. אבל אז מגיעה המשימה הכי כנה – להפוך את המולטימדיה הזו לבלוג כתוב שיכול להגיע לקהל רחב יותר.
דמיין כלי שמבין את הערך האמיתי של התוכן שלך ועוזר לך להאיץ את תהליך יצירת התוכן.
וידסקרייב AI: בנוי לעתיד
קבלו את VidScribe AI: לא רק כלי נוסף, אלא מהפכת יצירת תוכן שהופכת שעות של עבודה לדקות של קסם. ✨
Vidscribe AI מאפשר לך להפוך את הווידאו והאודיו שלך לפוסטים בבלוג מרתקים ומותאמים לSEO. Vidscribe AI מעוצב למען יוצרי תוכן, פודקאסטרים, כותבים וכו', שרוצים למקסם את הגעת התוכן שלהם. ה-AI מבין את ההקשר של התוכן שלך ויוצר מאמר קריא, מותאם לSEO שתופס את המהות של המדיה המקורית שלך.
אולי אתה תוהה איך כל זה עובד? הבה נראה איך VidScribe AI עושה את הקסם שלו.
איך Vidscribe AI עובד?
ובכן, זה פשוט מאוד:
-
העלה את התוכן המולטימדיה שלך בין אם זה דיון פודקאסט נלהב, וידאו מספק מידע ביוטיוב, או טוריאל וידאו מפורט, VidScribe AI יכול להתמודד איתו.
-
בהמשך, תנו ל-VidScribe AI לעשות את הקסם שלו. זה לא רק מתעתיק – זה מבין הקשר, טון ומסרים מרכזיים.
-
סיימנו! מזל טוב על יצירת הבלוג שלכם. עכשיו התוכן המולטימדיה שלכם הומר לפוסט בלוג מעורב, מותאם ל-SEO. 🚀
תכונות
כעת, בואו נחקור כמה תכונות מדהים ש-VidScribe AI מציע.
תרגום וידאו ואודיו 📝
ממיר מילים מדוברות מסרטונים או קובצי אודיו לטקסט כתוב. מבטיח דיוק גבוה באמצעות זיהוי דיבור מבוסס AI.
מבנה בלוג מבוסס AI ✍️
מעצב את התוכן המופק למבנים מוכנים לבלוג עם כותרות, תת-כותרות ופסקאות.
אפשרויות התאמה אישית 🎨
משתמשים יכולים להתאים את האורך והעומק של הבלוגים המיוצרים, לבחור בין סיכומים קצרים או מאמרים מפורטים. תכונה זו מציעה גם עריכה ידנית ואפשרות להוסיף שינויים אישיים לתוכן המיוצר על ידי ה-AI.
בלוגים מותאמים ל-SEO 🌐
מזהה מילות מפתח נפוצות ומותאמות לSEO על סמך התוכן של הווידאו/האודיו. ומשלב מילות מפתח אלה באופן טבעי לתוך הבלוגים כדי לשפר את הגילוי במנועי החיפוש. לא עוד מטרד עם כתיבת בלוגים מותאמים לSEO. VidScribe AI כבר עשה את זה עבורך!
חילוץ מיידי ⬇️
הוצא בלוגים מוגנרטים בהבזק של עין. אין צורך להמיר אותם באופן ידני לפורמט כלשהו. VidScribe AI כבר מספק אותם בפורמט markdown.
מרעיון ליצירה
כל רעיון מפתיע מתחיל בתפיסה, וכך גם לגבי VidScribe AI. התחלנו עם תפיסה פשוטה; הבה נראה איך הפכנו את הרעיון הזה למציאות.
גיבוש רעיונות
התחלתי עם תצפית פשוטה אך חזקה ובעיה. אנשים מבלים יותר זמן בהמרת התוכן שלהם מאשר ביצירתו. לפעמים, הם צריכים לכתוב וגם ליצור. זה המקום שבו החלטנו לפתח משהו שיפתור את הבעיה הזו.
עיצוב
כפי שאמר סטיב ג'ובס:
"עיצוב אינו רק מה שהוא נראה ומרגיש. עיצוב זה איך שהוא עובד."
– סטיב ג'ובס
בהתאם לפילוסופיה זו, התחלתי לעצב את הממשק של VidScribe AI על ידי ניהול מחקר וחשיבה על איך להפוך את העיצוב ליצירתי ופשוט. הרבה כלים מבוססי AI קיימים נראים מורכבים מדי למשתמשים חדשים. זה המקום שבו החלטתי לעצב ממשק שהוא גם פשוט וגם יצירתי, כדי לאפשר למשתמשים חדשים להשתמש בו בקלות ללא קושי.
פיתוח
אחרי העיצוב, הגיע הזמן להתחיל לעבוד בכבדות. התחלתי בבחירת הטכנולוגיה הטובה ביותר לצורך העמקת הצרכים של הפרויקט, כמו המרה בדיוק גבוה של דיבור לטקסט וניתנות להרחבה.
בשלב הראשוני, עברתי דרך גרסאות רבות והתגברתי על בעיות שונות. זה נכון שהשלבים הראשונים של הפיתוח הם כמו מכשולים. כל גרסה הביאה איתה אתגרים משלה, אבל התמודדתי איתם אחד אחד.
ככל שהגרסאות התחילו לקבל צורה, כל בדיקה הרגישה כמו אבן דרך, וכל בעיה מתוקנת הייתה ניצחון קטן. זו הייתה הפעם הראשונה שלי בשילוב מודוס באפליקציית AI. היו סוגים שונים של בעיות, אבל התייחסות לתיעוד של מודוס הקלה על התהליך שלי. תהליך הפיתוח הזה לא היה רק על כתיבת קוד; הוא היה על התפתחות מתמדת של הפתרון ויישום חשיבה ביקורתית.
בהמשך, מגיע החלק של ה-AI שבו הייתי אמור לשפר ולאמן את המודל כך שיעשה את עבודתו בצורה מושלמת.
- החלטתי להשתמש במודל Whisper של ChatGPT להמרת דיבור לטקסט. המודל Whisper, שפותח על ידי OpenAI, ניצב בולט בשדה המאובק של טכנולוגיות המרת דיבור לטקסט בשל דיוקו המרשים ותמיכתו הרב-לשונית. ארכיטקטורת הלמידה העמוקה של המודל, שאומנה על מערך נתונים גדול ומגוון, מאפשרת לו להתמודד עם מבטאים שונים, רעשי רקע וניואנסים לשוניים בדיוק יוצא דופן.
- הנה הצצה לשילוב המודל Whisper:
const transcriptions = await openai.audio.transcriptions.create({
model: "whisper-1",
file: file,
});
תהליך השילוב כלל מספר שלבים:
-
הגדרה מדויקת של פרמטרי המודל כדי למטב את הביצועים.
-
יישום טיפול בשגיאות חזק ומנגנוני גיבוי.
-
כוונון עדין של המודל למקרה השימוש הספציפי שלנו ולתכונות קלט האודיו.
-
שנית, לצורך יצירת בלוגים החלטתי להשתמש במודל Llama 3.1-8B-Instruct של Meta. מודל השפה הגדול והחזק הזה הביא לפרויקט יכולות הבנה ויצירה מתוחכמות של שפה טבעית. המודל עם 8 מיליארד פרמטרים מציע איזון אופטימלי בין יעילות ליצירה, מה שמאפשר לנו ליצור תוכן רלוונטי קונטקסטואלית.
השילוב של המודל הזה כלל:
-
פיתוח אסטרטגיית עידוד מדויקת להנחיית הפלט של המודל
-
יישום ניהול הקשרים כדי להבטיח יצירת תוכן עקבי ורלוונטי
-
יצירת אמצעי זהירות לשמירה על איכות התוכן והמקוריות שלו
כך נראית תצורת המודל:
{
"$schema": "https://schema.hypermode.com/modus.json",
"endpoints": {
"default": {
"type": "graphql",
"path": "/graphql",
"auth": "bearer-token"
}
},
"models": {
"text-generator": {
"sourceModel": "meta-llama/Meta-Llama-3.1-8B-Instruct",
"provider": "hugging-face",
"connection": "hypermode"
}
}
}
לאחר מכן, השתמשתי ב-Modus SDK כדי לזמן מודלים באופן דינמי. אז, סיפקתי הוראות ופרומפטים למודלים כדי להשיג את התוצאות הרצויות ביותר. Modus הופך את זה להרבה יותר קל להריץ כל מודל AI במהירות.
import { models } from "@hypermode/modus-sdk-as";
import {
OpenAIChatModel,
ResponseFormat,
SystemMessage,
UserMessage,
} from "@hypermode/modus-sdk-as/models/openai/chat";
// this model name should match the one defined in the modus.json manifest file
const modelName: string = "text-generator";
export function generateBlogContent(transcriptions: string): string {
const instruction =
"You are a skilled content writer that converts audio transcriptions into well-structured, engaging blog posts in Markdown format. Create a comprehensive blog post with a catchy title, introduction, main body with multiple sections, and a conclusion. Analyze the user's writing style from their previous posts and emulate their tone and style in the new post. Keep the tone casual and professional.";
const prompt = `Please convert the following transcription into a well-structured blog post using Markdown formatting. Follow this structure:
1. Start with a SEO friendly catchy title on the first line.
2. Add two newlines after the title.
3. Write an engaging introduction paragraph.
4. Create multiple sections for the main content, using appropriate headings (##, ###).
5. Include relevant subheadings within sections if needed.
6. Use bullet points or numbered lists where appropriate.
7. Add a conclusion paragraph at the end.
8. Ensure the content is informative, well-organized, and easy to read.
9. Emulate my writing style, tone, and any recurring patterns you notice from my previous posts.
Here's the transcription to convert: ${transcriptions}`;
const model = models.getModel<OpenAIChatModel>(modelName);
const input = model.createInput([
new SystemMessage(instruction),
new UserMessage(prompt),
]);
// this is one of many optional parameters available for the OpenAI chat interface
input.temperature = 0.7;
const output = model.invoke(input);
return output.choices[0].message.content.trim();
}
להיות כנה, אף אחד מזה לא היה אפשרי ללא העזרה של Modus. ממשק הזימון של המודלים שלהם הוכח כפתרון מהפכני ולכן הקל ביותר לתהליך שילוב AI. על ידי שימוש ב-Modus, קיבלתי גמישות וקלות בעבודה עם מודלי AI מורכבים אלה.
השיתוף הפעולה בין Modus, Whisper, ו-Llama 3.1 יצר מערכת אקולוגית חזקה שהפכה את הקונספט הראשוני הזה לכלי יצירת תוכן חכם ומלא תפקוד.
הפעלה 🎉
אחרון אבל לא פחות חשוב, לחצתי על כפתור "הפעל" ב-Vercel עם כלי מוצלח שמזרז את תהליך יצירת התוכן.
ערכת טכנולוגיה
-
חזית: NextJS, TailwindCSS, Shadcn UI
-
מאחור: Hypermode (https://hypermode.com)
קישורים מועילים
-
מאגר Vidscibe AI: https://github.com/Darshancodes/Vidscribe-ai
-
מודל Hypermode (מאחורי הקלעים של Vidscribe): https://github.com/Darshancodes/vidscribe-modus-backend
סיכום
הצמיחה המהירה של בינה מלאכותית מחוללת מהפכה בדרך שבה אנו יוצרים תוכן. לא עוד כתיבה ידנית, יצירה והמרה – הבינה המלאכותית מכסה את כל זה!
הפרויקט הזה לא יעצור כאן. הוא מתוכנן עם מספר תכונות מרתקות שיביאו את Vidscribe לרמה הבאה. תשמרו על העדכונים!
תודה מיוחדת ל-Hypermode ול-Hashnode על ארגון ההאקתון המדהים הזה. לחדשנות ויצירתיות, למדנו הרבה! 🚀
Source:
https://darshancodes.hashnode.dev/introducing-vidscribeai