مقدمة لـ Vidscribe AI: المستقبل لإنشاء المحتوى بدون جهد

إن إنشاء المحتوى مرهق. تسجيل مقاطع الفيديو، تحرير البودكاست، ثم كتابة المدونات؟ إنه مثل خوض ثلاثة ماراثونات قبل الإفطار. ولكن ماذا لو كانت هناك طريقة لتقليل عبء العمل بنسبة 90%؟

حسناً، كل هذا بدأ بمشكلة شخصية. تقضي ساعات عديدة في التخطيط والتسجيل وتحرير فيديو أو بودكاست. المحتوى الخاص بك مليء بالأفكار والقيمة. ولكن تأتي بعد ذلك المهمة الأكثر صدقًا – تحويل تلك الوسائط المتعددة إلى مدونة مكتوبة يمكن أن تصل إلى جمهور أوسع.

تخيل أداة تفهم القيمة الحقيقية لمحتواك وتساعدك في تسريع عملية إنشاء المحتوى.

Vidscribe AI: مُصممة للمستقبل

https://youtu.be/JuLLwGcacGk

تعرف على VidScribe AI: ليست مجرد أداة أخرى، بل ثورة في إنشاء المحتوى تحول ساعات العمل إلى دقائق من السحر. ✨

تتيح لك Vidscribe AI تحويل مقاطع الفيديو والصوت إلى منشورات مدونة جذابة ومُحسّنة لمحركات البحث. تم تصميم Vidscribe AI لمبدعي المحتوى، ومقدمي البودكاست، والكتّاب، وغيرهم، الذين يرغبون في زيادة مدى وصول محتواهم. يفهم الذكاء الاصطناعي سياق محتواك وينشئ مقالًا قابلاً للقراءة ومُحسّنًا لمحركات البحث يعكس جوهر وسائطك الأصلية.

قد تتساءل كيف تعمل كل هذه الأمور؟ دعنا نرى كيف يقوم VidScribe AI بسحره.

كيف يعمل Vidscribe AI؟

حسناً، الأمر بسيط للغاية:

قم بتحميل محتواك المتعدد الوسائط سواء كانت مناقشة حماسية في بودكاست، أو فيديو تعليمي على يوتيوب، أو درس فيديو مفصل، يمكن لـ VidScribe AI التعامل مع ذلك.
الخطوة التالية، دع VidScribe AI يقوم بسحره. إنه لا يقوم فقط بتفريغ النص— بل يفهم السياق والنبرة والرسائل الرئيسية.
تم! تهانينا على إنشاء مدونتك. الآن تم تحويل محتوى الوسائط الخاص بك إلى مقال مدونة جذاب مُحسّن لمحركات البحث. 🚀

الميزات

الآن، دعنا نستكشف بعض الميزات المذهلة التي يقدمها VidScribe AI.

تفريغ الفيديو والصوت 📝

يحوّل الكلمات المنطوقة في الفيديوهات أو الصوتيات إلى نص مكتوب. مما يضمن دقة عالية من خلال التعرف على الكلام بتقنية الذكاء الاصطناعي.

هيكلة المدونة بتقنية الذكاء الاصطناعي ✍️

يقوم بتنسيق المحتوى المستخرج إلى هياكل جاهزة للمدونة مع عناوين وعناوين فرعية وفقرات.

خيارات التخصيص 🎨

يمكن للمستخدمين ضبط طول وعمق المدونات المولّدة، اختيارًا بين ملخصات موجزة أو مقالات مفصلة. توفر هذه الميزة أيضًا التحرير اليدوي والقدرة على إضافة تعديلات شخصية على المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي.

مدونات مُحسّنة لمحركات البحث 🌐

يحدد الكلمات الرئيسية الرائجة والمحسّنة لمحركات البحث بناءً على محتوى الفيديو/الصوت. ويقوم بتضمين الكلمات الرئيسية بشكل طبيعي في المدونات لتعزيز الظهور في محركات البحث. لا مزيد من المتاعب في كتابة مدونات محسّنة لمحركات البحث. لقد قامت VidScribe AI بذلك من أجلك بالفعل!

استخراج فوري ⬇️

استخرج المدونات التي تم إنشاؤها في لمح البصر. لا تحتاج إلى تحويلها يدويًا إلى أي تنسيق. توفر VidScribe AI ذلك بالفعل بتنسيق Markdown.

من الفكرة إلى الإبداع

تبدأ كل فكرة رائدة بمفهوم، وينطبق الشيء نفسه على VidScribe AI. بدأنا بمفهوم بسيط؛ دعنا نرى كيف حولنا هذه الفكرة إلى واقع.

توليد الأفكار

بدأت بملاحظة بسيطة ولكن قوية ومشكلة. يقضي الناس وقتًا أطول في تحويل محتواهم بدلاً من إنشائه. أحيانًا، يحتاجون إلى الكتابة بالإضافة إلى الإبداع. هنا قررنا تطوير شيء لحل هذه المشكلة.

التصميم

كما قال ستيف جوبز:

“التصميم ليس فقط ما يبدو عليه وما يشعر به. التصميم هو كيف يعمل.”
– ستيف جوبز

مع وضع هذه الفلسفة في الاعتبار، بدأت في تصميم واجهة VidScribe AI من خلال إجراء أبحاث والتفكير في كيفية جعل التصميم مبدعًا وبسيطًا. تبدو العديد من أدوات الذكاء الاصطناعي الموجودة معقدة جدًا للمستخدمين الجدد. هنا قررت تصميم واجهة تكون بسيطة ومبدعة في نفس الوقت، مما يسمح للمستخدمين الجدد باستخدامها بسهولة دون أي متاعب.

التطوير

بعد التصميم، حان الوقت لبدء التنفيذ. بدأت بتحديد أفضل التقنيات التي تلبي احتياجات المشروع، مثل تحويل الصوت إلى نص بدقة عالية وقابلية التوسع.

في المرحلة الأولية، مررت بعدة تكرارات وتغلبت على مشاكل مختلفة. من الصحيح أن مراحل التطوير الأولية تشبه العقبات. كل تكرار جلب معه مجموعة من التحديات، لكنني تغلبت عليها واحدة تلو الأخرى.

مع بدء تشكيل التكرارات، شعرت أن كل اختبار هو نقطة تحول، وأن حل كل مشكلة كانت انتصارًا صغيرًا. كانت هذه أول مرة أدمج فيها Modus في تطبيق الذكاء الاصطناعي. كانت هناك أنواع مختلفة من المشاكل، لكن الرجوع إلى وثائق Modus جعل عملية البرمجة أسهل. كانت هذه العملية التطويرية لا تتعلق فقط بكتابة الشفرة؛ بل كانت عن تطوير الحل باستمرار وتطبيق التفكير النقدي.

الآن، يأتي دور الذكاء الاصطناعي حيث كان علي تنقيح وتدريب النموذج بطريقة تجعله يقوم بوظيفته بدقة.

قررت استخدام نموذج Whisper من ChatGPT لتحويل الكلام إلى نص. يبرز Whisper، الذي طورته OpenAI، بين التقنيات المتعددة لتحويل الصوت إلى نص بفضل دقته الملحوظة ودعمه للعديد من اللغات. تتيح هندسته العميقة للتعلم، التي تدرب على مجموعة بيانات ضخمة ومتنوعة، له التعامل مع اللهجات المختلفة والضوضاء الخلفية والدقات اللغوية بدقة استثنائية.

إليك لمحة سريعة عن دمج نموذج Whisper:

const transcriptions = await openai.audio.transcriptions.create({
  model: "whisper-1",
  file: file,
});

شملت عملية الدمج عدة خطوات:

ضبط معلمات النموذج بعناية لتحسين الأداء.
تنفيذ معالجة الأخطاء الصارمة وآليات التراجع.
ضبط النموذج بدقة ليناسب حالة الاستخدام الخاصة بنا وخصائص إدخال الصوت.
ثانيًا، لتوليد المدونات، اخترت استخدام نموذج Meta’s Llama 3.1-8B-Instruct. هذا النموذج القوي للغة الكبيرة جلب قدرات متقدمة في فهم اللغة الطبيعية وتوليدها للمشروع. يحقق نموذج 8B التوازن الأمثل بين الكفاءة والتوليد، مما يمكننا من إنشاء محتوى ملائم سياقيًا.

تضمن دمج هذا النموذج:

تطوير استراتيجية توجيه دقيقة لإرشاد مخرجات النموذج
تنفيذ إدارة السياق لضمان توليد محتوى متسق وملائم
إنشاء ضمانات للحفاظ على جودة المحتوى وأصالته

إليك كيفية تكوين النموذج:

{
  "$schema": "https://schema.hypermode.com/modus.json",
  "endpoints": {
    "default": {
      "type": "graphql",
      "path": "/graphql",
      "auth": "bearer-token"
    }
  },
  "models": {
    "text-generator": {
      "sourceModel": "meta-llama/Meta-Llama-3.1-8B-Instruct",
      "provider": "hugging-face",
      "connection": "hypermode"
    }
  }
}

بعد ذلك، استخدمت Modus SDK لاستدعاء النماذج ديناميكيًا. ثم قدمت التعليمات والمطالبات للنماذج لتحقيق أفضل النتائج المرجوة. يجعل Modus من السهل جدًا تشغيل أي نموذج ذكاء اصطناعي بسرعة.

import { models } from "@hypermode/modus-sdk-as";
import {
  OpenAIChatModel,
  ResponseFormat,
  SystemMessage,
  UserMessage,
} from "@hypermode/modus-sdk-as/models/openai/chat";

// this model name should match the one defined in the modus.json manifest file
const modelName: string = "text-generator";

export function generateBlogContent(transcriptions: string): string {
  const instruction =
    "You are a skilled content writer that converts audio transcriptions into well-structured, engaging blog posts in Markdown format. Create a comprehensive blog post with a catchy title, introduction, main body with multiple sections, and a conclusion. Analyze the user's writing style from their previous posts and emulate their tone and style in the new post. Keep the tone casual and professional.";
  const prompt = `Please convert the following transcription into a well-structured blog post using Markdown formatting. Follow this structure:

1. Start with a SEO friendly catchy title on the first line.
2. Add two newlines after the title.
3. Write an engaging introduction paragraph.
4. Create multiple sections for the main content, using appropriate headings (##, ###).
5. Include relevant subheadings within sections if needed.
6. Use bullet points or numbered lists where appropriate.
7. Add a conclusion paragraph at the end.
8. Ensure the content is informative, well-organized, and easy to read.
9. Emulate my writing style, tone, and any recurring patterns you notice from my previous posts.

Here's the transcription to convert: ${transcriptions}`;
  const model = models.getModel<OpenAIChatModel>(modelName);
  const input = model.createInput([
    new SystemMessage(instruction),
    new UserMessage(prompt),
  ]);

  // this is one of many optional parameters available for the OpenAI chat interface
  input.temperature = 0.7;

  const output = model.invoke(input);
  return output.choices[0].message.content.trim();
}

بصراحة، لم يكن أي من هذا ممكنًا بدون مساعدة Modus. لقد أثبتت واجهة برمجة تطبيقات استدعاء النموذج الخاصة بهم أنها الحل الأكثر سهولة لعملية تكامل الذكاء الاصطناعي. باستخدام Modus، حصلت على المرونة والسهولة في العمل مع هذه النماذج المعقدة للذكاء الاصطناعي.

خلقت التعاون بين Modus و Whisper و Llama 3.1 نظامًا بيئيًا قويًا حول هذا المفهوم الأولي إلى أداة فعالة لتوليد المحتوى الذكي.

النشر 🎉

أخيرًا وليس آخرًا، قمت بالنقر على زر “نشر” على Vercel بأداة ناجحة تقوم بتبسيط عملية إنشاء المحتوى.

التقنيات المستخدمة

الواجهة الأمامية: NextJS، TailwindCSS، Shadcn UI
الواجهة الخلفية: Hypermode (https://hypermode.com)

روابط مفيدة

مباشر على: https://vidscribe-ai.vercel.app
مستودع Vidscibe AI: https://github.com/Darshancodes/Vidscribe-ai
نموذج Hypermode (Vidscribe Backend): https://github.com/Darshancodes/vidscribe-modus-backend

الاستنتاج

النمو السريع للذكاء الاصطناعي يقوم بثورة في طريقة إنشاء المحتوى. لا مزيد من الكتابة اليدوية والإنشاء والتحويل – الذكاء الاصطناعي يغطي كل ذلك!

هذا المشروع لن يتوقف هنا. هو مخطط لتقديم ميزات مثيرة متعددة سترفع Vidscribe إلى المستوى التالي. ترقبوا!

شكر خاص لـ Hypermode و Hashnode على تنظيم هذه المسابقة الرائعة. إلى الإبتكار والإبداع، تعلمنا الكثير! 🚀