Οι 5 Καλύτερες Γεννήτριες Εικόνας AI ανοιχτού κώδικα

Γρήγοροι Σύνδεσμοι

Παστέλ

Σταθερή Διάχυση 1.5

DreamShaper

InvokeAI

Ανοιχτό ταξίδι

Τα μοντέλα δημιουργίας κειμένου σε εικόνα που βασίζονται σε τεχνητή νοημοσύνη είναι παντού και γίνονται πιο εύκολα προσβάσιμα καθημερινά. Αν και είναι εύκολο απλώς να επισκεφτείτε έναν ιστότοπο και να δημιουργήσετε την εικόνα που αναζητάτε, οι γεννήτριες κειμένου σε εικόνα ανοιχτού κώδικα είναι το καλύτερο στοίχημά σας εάν θέλετε περισσότερο έλεγχο στη διαδικασία δημιουργίας.

ΚΑΤΑΣΚΕΥΗ ΒΙΝΤΕΟ ΤΗΣ ΗΜΕΡΑΣ ΚΥΛΙΣΤΕ ΓΙΑ ΝΑ ΣΥΝΕΧΙΣΕΤΕ ΜΕ ΠΕΡΙΕΧΟΜΕΝΟ

Υπάρχουν δεκάδες δωρεάν και ανοιχτού κώδικα γεννήτριες κειμένου σε εικόνα AI που είναι διαθέσιμες στο διαδίκτυο που ειδικεύονται σε συγκεκριμένα είδη εικόνων. Λοιπόν, κοιτάξαμε το σωρό και βρήκαμε τις καλύτερες γεννήτριες κειμένου σε εικόνα AI ανοιχτού κώδικα που μπορείτε να δοκιμάσετε αυτήν τη στιγμή.

1 Παστέλ

Το Craiyon είναι μια από τις πιο εύκολα προσβάσιμες γεννήτριες εικόνων AI ανοιχτού κώδικα. Βασίζεται στο DALL-E Mini και ενώ μπορείτε να το κλωνοποιήσετε Αποθετήριο Github και εγκαταστήστε το μοντέλο τοπικά στον υπολογιστή σας, η Craiyon φαίνεται να έχει εγκαταλείψει αυτήν την προσέγγιση υπέρ του ιστότοπού της.

Το επίσημο αποθετήριο Github δεν έχει ενημερωθεί από τον Ιούνιο του 2022, αλλά το πιο πρόσφατο μοντέλο εξακολουθεί να είναι διαθέσιμο δωρεάν στο επίσημος ιστότοπος Craiyon . Δεν υπάρχουν εφαρμογές Android ή iOS.

Όσον αφορά τη λειτουργικότητα, θα δείτε όλες τις συνήθεις επιλογές που περιμένετε από μια γεννήτρια εικόνας AI. Μόλις εισαγάγετε την προτροπή και λάβετε μια εικόνα, μπορείτε να χρησιμοποιήσετε τη δυνατότητα αναβάθμισης για να λάβετε ένα αντίγραφο υψηλότερης ανάλυσης. Υπάρχουν τρία στυλ για να διαλέξετε: Τέχνη, Φωτογραφία και Σχέδιο. Μπορείτε επίσης να επιλέξετε 'Καμία' εάν θέλετε να αποφασίσει το μοντέλο.

Επιπλέον, η 'Λειτουργία ειδικού' σάς επιτρέπει να συμπεριλάβετε αρνητικές λέξεις, κάτι που λέει στο μοντέλο να αποφεύγει συγκεκριμένα στοιχεία. Υπάρχει επίσης μια δυνατότητα πρόβλεψης προτροπής, η οποία χρησιμοποιεί το ChatGPT για να βοηθά τους χρήστες να γράφουν τα καλύτερα, πιο λεπτομερή μηνύματα. Τέλος, οι λειτουργίες αφαίρεσης φόντου με τεχνητή νοημοσύνη μπορούν να σας βοηθήσουν να εξοικονομήσετε χρόνο και προσπάθεια περικοπής φόντου από εικόνες.

πώς να δημιουργήσετε ένα αρχείο .bat windows 10

Και αυτό είναι για όλα όσα κάνει ο Craiyon. Δεν είναι το πιο εξελιγμένο μοντέλο δημιουργίας εικόνων AI, αλλά τα πάει καλά ως βασικό μοντέλο, αν δεν θέλετε κάτι λεπτομερές ή ρεαλιστικό.

Το μοντέλο είναι δωρεάν στη χρήση, αλλά οι δωρεάν χρήστες περιορίζονται σε εννέα δωρεάν εικόνες κάθε φορά μέσα σε ένα λεπτό. Μπορείτε να εγγραφείτε στις βαθμίδες Υποστηρικτών ή Επαγγελματιών τους (με τιμή 5 $ και 20 $ το μήνα, αντίστοιχα, και χρεώνονται ετησίως) για να μην λαμβάνετε διαφημίσεις ή υδατογραφήματα, ταχύτερη δημιουργία και την επιλογή να κρατάτε ιδιωτικές τις εικόνες που δημιουργούνται. Ένα προσαρμοσμένο επίπεδο συνδρομής επιτρέπει επίσης προσαρμοσμένα μοντέλα, ενοποίηση, αποκλειστική υποστήριξη και ιδιωτικούς διακομιστές.

2 Σταθερή Διάχυση 1.5

Το Stable Diffusion είναι ίσως ένα από τα πιο δημοφιλή μοντέλα δημιουργίας κειμένου σε εικόνα ανοιχτού κώδικα. Τροφοδοτεί επίσης άλλα μοντέλα, συμπεριλαμβανομένων των τριών γεννητριών εικόνας που αναφέρονται παρακάτω. Κυκλοφόρησε το 2022 και έκτοτε έχει πολλές υλοποιήσεις.

Θα σας περισώσω τις υπερβολικά τεχνικές λεπτομέρειες του τρόπου λειτουργίας του μοντέλου (για τις οποίες μπορείτε να ελέγξετε το δικό τους επίσημο αποθετήριο Github ), αλλά το μοντέλο είναι εύκολο στην εγκατάσταση ακόμη και για εντελώς αρχάριους και λειτουργεί καλά αρκεί να έχετε μια αποκλειστική GPU με τουλάχιστον 4 GB μνήμης. Μπορείτε επίσης να έχετε πρόσβαση Σταθερή Διάχυση στο Διαδίκτυο και σας καλύψαμε αν θέλετε εκτελέστε το Stable Diffusion σε Mac .

Υπάρχουν αρκετά σημεία ελέγχου (εξετάστε τα ως εκδόσεις) διαθέσιμα για χρήση για τη σταθερή διάχυση. Ενώ δοκιμάσαμε την έκδοση 1.5, έκδοση 2.1 είναι επίσης σε ενεργό ανάπτυξη και είναι πιο ακριβής.

Yadullah Abidi/MakeUseOf/DreamShaper

Η εκτέλεση του μοντέλου είναι επίσης αρκετά εύκολη. Το δοκιμάσαμε με το AUTOMATIC1111 Διασύνδεση χρήστη Ιστού Σταθερής Διάχυσης , και όλα τα στοιχεία ελέγχου και οι παράμετροι λειτουργούν καλά. Είναι επίσης αρκετά ανθεκτικό στο NSFW χάρη στη βάση δεδομένων LAION-5B στην οποία εκπαιδεύτηκε το μοντέλο (αν και δεν είναι τέλειο, προσέξτε). Ενώ ο ίδιος ο χρόνος παραγωγής θα ποικίλλει ανάλογα με το υλικό σας, μπορείτε να περιμένετε ότι οι εικόνες σας θα είναι λεπτομερείς και ρεαλιστικές ακόμη και με βασικές προτροπές.

3 DreamShaper

Το DreamShaper είναι ένα μοντέλο δημιουργίας εικόνας που βασίζεται στο Stable Diffusion. Προοριζόταν ως εναλλακτική λύση ανοιχτού κώδικα στο MidJourney και εστιάζει στον φωτορεαλισμό στις δημιουργούμενες εικόνες, αν και μπορεί να χειριστεί τα anime και τα στυλ ζωγραφικής εξίσου καλά με μερικές τροποποιήσεις.

Το μοντέλο είναι πιο ικανό από το Stable Diffusion, επιτρέποντας στους χρήστες περισσότερη ελευθερία στην τελική έξοδο, που κυμαίνονται από βελτιώσεις αστραπής έως χαλαρότερους περιορισμούς NSFW. Η λειτουργία του μοντέλου είναι επίσης εύκολη, με α διαθέσιμη, προεκπαιδευμένη έκδοση με δυνατότητα λήψης online για τοπική πρόσβαση και μια σειρά από ιστοτόπους, συμπεριλαμβανομένων Σίνκιν.αι , RandomSeed , και Μάγος.χώρος (απαιτεί μια βασική συνδρομή) που σας επιτρέπει να εκτελέσετε το μοντέλο με επιτάχυνση GPU.

Όπως πιθανότατα μπορείτε να μαντέψετε μέχρι τώρα, οι εικόνες που δημιουργούνται από το DreamShaper τείνουν να φαίνονται πιο ρεαλιστικές σε σύγκριση με το Stable Diffusion. Ακόμα κι αν εκτελείτε την ίδια προτροπή και στα δύο μοντέλα, το μοντέλο DreamShaper θα είναι πιθανότατα πιο ρεαλιστικό, λεπτομερές και πιο φωτεινό.

Αυτό ισχύει ιδιαίτερα για πορτρέτα ή χαρακτήρες, κάτι που βρήκα ότι το Stable Diffusion λείπει σε σύγκριση με την ίδια προτροπή. Εάν οι εικόνες σας γίνονται πολύ ρεαλιστικές, ορίστε τέσσερις τρόποι αναγνώρισης μιας εικόνας που δημιουργείται από AI .

είναι ασφαλές το υπόγειο app amazon

Δεν χρειάζεστε ούτε έναν υπολογιστή μεγαθήρια για να εκτελέσετε το μοντέλο. Η GTX 1650Ti με 4 GB VRAM έτρεχε το μοντέλο τέλεια. Ο χρόνος παραγωγής ήταν λίγο μεγαλύτερος, αλλά δεν φαινόταν να επηρεάζει την πραγματική απόδοση. Τούτου λεχθέντος, μπορεί να χρειαστείτε GPU με περισσότερη VRAM για την εκτέλεση του DreamShaper XL, το οποίο βασίζεται στο μοντέλο Stable Diffusion XL.

4 InvokeAI

Το Invoke AI είναι ένα άλλο μοντέλο δημιουργίας εικόνων που βασίζεται σε AI που βασίζεται στο Stable Diffusion, με μια έκδοση XL που βασίζεται στο Stable Diffusion XL. Έχει επίσης τη δική του διεπαφή χρήστη ιστού και γραμμής εντολών, που σημαίνει ότι δεν θα χρειαστεί να κάνετε άλματα με πράγματα όπως η διεπαφή ιστού Stable Diffusion.

Το μοντέλο εστιάζει στο να επιτρέπει στους χρήστες να δημιουργούν γραφικά με βάση την πνευματική τους ιδιοκτησία με προσαρμοσμένες ροές εργασίας. Το InvokeAI είναι ένα από τα καλύτερα μοντέλα δημιουργίας εικόνων AI ανοιχτού κώδικα για εκπαίδευση προσαρμοσμένων μοντέλων και εργασία με πνευματική ιδιοκτησία.

Του επίσημο αποθετήριο Github παραθέτει δύο μεθόδους εγκατάστασης: εγκατάσταση μέσω του προγράμματος εγκατάστασης του InvokeAI ή χρήση PyPI, εάν αισθάνεστε άνετα με ένα τερματικό και την Python και χρειάζεστε περισσότερο έλεγχο στα πακέτα που είναι εγκατεστημένα με το μοντέλο.

Ωστόσο, ο επιπλέον έλεγχος φέρνει ορισμένους περιορισμούς, κυρίως αυστηρότερες απαιτήσεις υλικού. Το InvokeAI συνιστά μια αποκλειστική GPU με τουλάχιστον 4 GB μνήμης, με έξι έως οκτώ GB που συνιστώνται για την εκτέλεση της παραλλαγής XL. Οι απαιτήσεις VRAM ισχύουν και για τις GPU της AMD και της Nvidia. Θα χρειαστείτε επίσης τουλάχιστον 12 GB μνήμης RAM και 12 GB ελεύθερου χώρου στο δίσκο για το μοντέλο, τις εξαρτήσεις του και την Python.

Yadullah Abidi/MakeUseOf/InvokeAI

Αν και η τεκμηρίωση δεν συνιστά τις GPU της Nvidia Series 10 και 16 GPU για την έλλειψη μνήμης βίντεο, το παρεχόμενο πρόγραμμα εγκατάστασης λειτουργούσε μια χαρά. Αν και τα χιλιόμετρα σας μπορεί να διαφέρουν, αν χρησιμοποιείτε GPU χαμηλότερης τεχνολογίας, περιμένετε περισσότερο για να δείτε τα μηνύματα σας να μετατρέπονται σε εικόνες. Τέλος, εάν χρησιμοποιείτε Windows, μπορείτε να χρησιμοποιήσετε μόνο μια GPU Nvidia, καθώς δεν υπάρχει υποστήριξη για GPU της AMD προς το παρόν.

Για το κομμάτι της δημιουργίας εικόνας, το μοντέλο τείνει να κλίνει περισσότερο προς τα καλλιτεχνικά στυλ παρά τον φωτορεαλισμό. Φυσικά, μπορείτε να εκπαιδεύσετε το μοντέλο στο σύνολο δεδομένων σας και να το βάλετε να δημιουργήσει εικόνες πιο κοντά σε αυτό που θέλετε, ακόμα κι αν αυτό περιλαμβάνει φωτορεαλιστικές εικόνες, ειδικά αν εργάζεστε σε σχεδιασμό προϊόντων, αρχιτεκτονική ή χώρους λιανικής. Ωστόσο, ένα σημαντικό πράγμα που πρέπει να έχετε κατά νου είναι ότι το InvokeAI είναι κυρίως μια μηχανή δημιουργίας εικόνων, που σημαίνει ότι πιθανότατα θα πρέπει να χρησιμοποιήσετε τα δικά σας μοντέλα για τα καλύτερα αποτελέσματα (που βρίσκονται εύκολα μέσω του διαχειριστή μοντέλων που παρέχεται στη διεπαφή ιστού) ως προεπιλογή Το μοντέλο είναι αρκετά παρόμοιο με το ίδιο το Stable Diffusion.

5 Ανοιχτό ταξίδι

Το Openjourney είναι ένα δωρεάν μοντέλο δημιουργίας εικόνων AI ανοιχτού κώδικα που βασίζεται για άλλη μια φορά στο Stable Diffusion. Αν αναρωτιέστε γιατί το μοντέλο ονομάζεται Openjourney, είναι επειδή εκπαιδεύτηκε σε εικόνες Midjourney και μπορεί να μιμηθεί το στυλ του στις εικόνες που δημιουργεί.

PromptHero , η εταιρεία πίσω από το Openjourney, σας επιτρέπει να δοκιμάσετε το μοντέλο μαζί με άλλα μοντέλα, όπως το Stable Diffusion (εκδόσεις 1.5 και 2), το DreamShaper και το Realistic Vision. Κατά την εγγραφή, λαμβάνετε 25 δωρεάν πιστώσεις (μία πίστωση για κάθε εικόνα που δημιουργείται), μετά από τις οποίες πρέπει να εγγραφείτε στο επίπεδο συνδρομής Pro, το οποίο κοστίζει 9 $ το μήνα και σας δίνει πρόσβαση σε 300 πιστώσεις κάθε μήνα με άλλες αποκλειστικές δυνατότητες.

Ωστόσο, αν θέλετε να το εκτελέσετε τοπικά και δωρεάν, μπορείτε κατεβάστε το αρχείο μοντέλου από το HuggingFace και εκτελέστε το χρησιμοποιώντας τη διεπαφή ιστού Stable Diffusion. Το Openjourney είναι επίσης το δεύτερο μοντέλο δημιουργίας εικόνων AI με τις περισσότερες λήψεις στο HuggingFace, ακριβώς πίσω από το Stable Diffusion.

Το Openjourney δεν παραθέτει συγκεκριμένες απαιτήσεις υλικού για την τοπική εκτέλεση του μοντέλου στον ιστότοπό του, αλλά μπορείτε να περιμένετε παρόμοιες απαιτήσεις υλικού με το Stable Diffusion. Αυτό σημαίνει μια αποκλειστική GPU με 4 GB VRAM, 16 GB RAM και περίπου 12 έως 15 GB ελεύθερου χώρου στον υπολογιστή σας για να αποθηκεύσετε το μοντέλο και τις εξαρτήσεις του.

sim δεν προβλέπεται mm #2

Yadullah Abidi/MakeUseOf/OpenJourney

Οι εικόνες που δημιουργούνται από το Openjourney τείνουν να ισορροπούν μεταξύ φωτορεαλισμού και τέχνης, εκτός εάν ορίζεται διαφορετικά. Αν ψάχνετε για ένα ολοκληρωμένο μοντέλο και προτιμάτε την εμφάνιση και αίσθηση Midjourney χωρίς να πληρώσετε για τη συνδρομή, το Openjourney είναι μια από τις καλύτερες επιλογές.