აღწერა

ორგანიზაცია ეძებს მონაცემთა მეცნიერს, რომელიც ჩამოაყალიბებს მონაცემების დათაგვის, დამუშავებისა და LLM-ებისთვის მომზადების საფუძვლებს. ძირითადი მოვალეობები მოიცავს: მონაცემთა დათაგვის სტრატეგიების შემუშავებას, ხარისხის მეტრიკების განსაზღვრას, LLM-ებისთვის ოპტიმალური მონაცემთა ფორმატების და სტრუქტურების კვლევას, და მონაცემთა ხარისხის ანალიზის პროცესების ავტომატიზაციას. საჭიროა მჭიდრო თანამშრომლობა საინჟინრო გუნდთან. მოთხოვნები: მონაცემთა მეცნიერებაში ან მანქანური სწავლების ინჟინერიაში მუშაობის გამოცდილება, განსაკუთრებით მონაცემთა ხარისხისა და მომზადების მიმართულებით. საჭიროა მონაცემთა ანოტაციის მეთოდოლოგიების და პლატფორმების ცოდნა, LLM-ების დატრენინგისთვის მონაცემთა მომზადების გამოცდილება (tokenization, embeddings, NER). Python-ის და შესაბამისი ბიბლიოთეკების (Pandas, NumPy, spaCy, Hugging Face) ცოდნა. API/SDK-ების გამოყენების გამოცდილება. სასურველია: აუდიო მონაცემთა დამუშავების გამოცდილება, თანამედროვე MLOps პრინციპების ცოდნა, RLHF-ის გამოცდილება. სამუშაო გარემო: გუნდი, რომელიც მუშაობს AI-ზე ორიენტირებულ ბაზარზე. აქცენტი კეთდება მაღალტექნოლოგიურ მუშაობაზე და გუნდის კულტურის ჩამოყალიბებაში მონაწილეობაზე. შეთავაზებულია კონკურენტული ანაზღაურება, წილობრივი მონაწილეობა და სხვა შეღავათები. მუშაობის სტილი მოიცავს როგორც სინქრონულ, ასევე ასინქრონულ თანამშრომლობას.