Yapay zeka ve makine öğrenmesi projelerinde, özellikle doğal dil işleme (NLP) ve büyük dil modelleri (LLM) ile çalışırken "embedding" verileri sistemin temel taşını oluşturur. Mock-jutsu kütüphanesinin sunduğu ai_vector fonksiyonu, bu karmaşık veri yapılarını simüle etmek için tasarlanmış profesyonel bir araçtır. Gerçek bir modelin çıktısını beklemeden veya maliyetli API çağrılarına ihtiyaç duymadan, yüksek kaliteli ve standartlara uygun mock data üretmenize olanak tanır. Bu fonksiyon, özellikle vektör veritabanları (Vector DB) ile entegre çalışan uygulamaların geliştirme ve test aşamalarında kritik bir rol oynar.
Teknik olarak ai_vector, N boyutlu ve L2-normalize edilmiş bir birim vektör (unit vector) üretir. Varsayılan olarak 384 boyutlu bir dizi oluşturan bu fonksiyon, günümüzde yaygın olarak kullanılan Sentence-BERT gibi açık kaynaklı embedding modelleriyle yapısal olarak tam uyumludur. L2 normalizasyonu algoritması sayesinde üretilen her vektörün öklid uzunluğu 1'e eşitlenir; bu da kosinüs benzerliği (cosine similarity) hesaplamaları içeren test senaryolarında matematiksel olarak tutarlı sonuçlar almanızı sağlar. İhtiyaca göre "--dims" parametresi kullanılarak boyut sayısı kolayca özelleştirilebilir. Örneğin, OpenAI'ın text-embedding-3-small modeli için 1536 boyutlu veya daha küçük modeller için farklı boyutlarda test verisi saniyeler içinde oluşturulabilir.
Bu fonksiyonun kullanım alanları oldukça çeşitlidir. Pinecone, Milvus veya Weaviate gibi vektör veritabanlarının indeksleme performansını ölçmek istediğinizde, mock-jutsu aracılığıyla toplu veri setleri oluşturarak yük testleri gerçekleştirebilirsiniz. Ayrıca, arama algoritmalarınızın doğruluğunu test etmek veya mikro hizmetler arasındaki veri iletim şemalarını doğrulamak için idealdir. Geliştiriciler, Python projelerinde `jutsu.generate('ai_vector')` metodunu kullanarak bu veriyi kod akışına dahil edebilir, CLI üzerinden hızlıca çıktı alabilir veya JMeter entegrasyonu sayesinde performans testlerini otomatize edebilirler.
Sonuç olarak ai_vector, AI tabanlı uygulamaların test süreçlerinde gerçek veriye olan bağımlılığı minimize ederek geliştirme hızını artırır. Mock-jutsu kütüphanesinin sağladığı bu sentetik veri üretme yeteneği, hem doğruluk hem de performans odaklı testlerde geliştiricilere esneklik sunar. Karmaşık matematiksel vektörleri manuel olarak oluşturma zahmetinden kurtulup, uygulamanızın mantığına odaklanmanıza yardımcı olan bu özellik, modern yapay zeka geliştirme süreçlerinin vazgeçilmez bir parçasıdır.
mockjutsu generate ai_vectormockjutsu bulk ai_vector --count 10mockjutsu export ai_vector --count 10 --format jsonmockjutsu export ai_vector --count 10 --format csvmockjutsu export ai_vector --count 10 --format sqlmockjutsu generate ai_vector --dims intfrom mockjutsu import jutsujutsu.generate('ai_vector')jutsu.bulk('ai_vector', count=10)jutsu.template(['ai_vector'], count=5)# with --dims parameterjutsu.generate('ai_vector', dims='int')${__mockjutsu_ai(ai_vector)}${__mockjutsu_ai(ai_vector:64)}# JMeter Function: __mockjutsu_ai# Parameter 1: ai_vector OR ai_vector:# Qualifier values: dimensions (int)# Parameter 2: (not required for this function)GET /generate/ai_vector# → {"type":"ai_vector","result":"...","status":"ok"}GET /bulk/ai_vector?count=10POST /template {"types":["ai_vector"],"count":1}| Parametre | Değerler | Açıklama |
|---|---|---|
| --dims | int | Vector dimensions |