ChatGPT , bilgi istemindeki bir talimatı takip etmek ve ayrıntılı bir yanıt vermek üzere eğitilmiş InstructGPT'nin kardeş modelidir. Chat GPT nedir? Chat GPT nasıl çalışıyor?
Araştırma önizlemesi sırasında ChatGPT kullanımı ücretsizdir
Orbit - Kullanıcıların geri bildirimlerini almak ve güçlü ve zayıf yönlerini öğrenmek için ChatGPT'yi tanıtmaktan heyecan duyuyoruz. Araştırma önizlemesi sırasında ChatGPT kullanımı ücretsizdir. Şimdi chat.openai.com'da deneyin .
Örnekler
Aşağıdaki örnekte ChatGPT , kodda hata ayıklamak için açıklayıcı sorular sorar.Aşağıdaki örnekte, ChatGPT başlangıçta yasa dışı faaliyetlerle ilgili olabilecek bir soruyu yanıtlamayı reddediyor ancak kullanıcı amacını netleştirdikten sonra yanıt veriyor.Aşağıdaki örnekte, ChatGPT önceki sorunun konusuna ("fermat'ın küçük teoremi") yapılan atıfları ("o") anlayabilir.Aşağıdaki örnekte ChatGPT , takip eden talimatlara verilen yanıtları sağlar.
ChatGPT nasıl çalışır?
kullanıcı
kendimi komşuma tanıtmak için kısa bir not yazmama yardım et
ChatGPT
Hi there,
My name is and I just moved in next door. I wanted to reach out and introduce myself. I’m looking forward to getting to know you and the neighborhood. If you ever need anything or just want to chat, please don’t hesitate to stop by or give me a call.
Best,
User
can you make it more formal?
ChatGPT
Dear Neighbor,
I am writing to introduce myself. My name is and I have recently moved in next door. I wanted to take a moment to reach out and say hello. I am looking forward to getting to know you and the neighborhood.
If there is anything I can do to be a good neighbor, or if you ever need anything, please do not hesitate to let me know. I am happy to help in any way that I can.
Sincerely,
User
benim için gönderebilir misin?
ChatGPT
Üzgünüm ama ben metin tabanlı bir AI asistanıyım ve sizin için fiziksel bir mektup gönderme yetkinliğim yok. Sadece ne yazacağım konusunda öneri ve tavsiye verebilirim. Bu tavsiyeyi alıp mektubu kendiniz göndermek size kalmış.
kullanıcı
bu kod beklediğim gibi çalışmıyor — nasıl düzeltebilirim?
resultWorkerErr := make(chan error)
defer close(resultWorkerErr)
go func() {
defer cancel()
resultWorkerErr <- b.resultWorker(ctx)
}()
err := b.worker(ctx)
cancel()
if err == nil {
return <-resultWorkerErr
}
return multierror.Append(err, <-resultWorkerErr)
ChatGPT
Daha fazla bağlam olmadan kodda neyin yanlış olduğunu söylemek zor. Kodun ne yapması gerektiği ve neyin beklendiği gibi çalışmadığı hakkında daha fazla bilgi verebilir misiniz? Ayrıca, bu kodun tamamı mı yoksa sadece bir kısmı mı?
kullanıcı
sadece bir kısmı - hata asla yüzeye çıkmaz. Kanalda bir sorun var sanırım
ChatGPT
Kodun ne yapması gerektiği ve yürütüldüğünde neler olduğu hakkında daha fazla bilgi olmadan söylemek zor. Sağladığınız kodla ilgili olası bir sorun, kanalın hiçbir zaman kapatılmamasıdır; bu, kanala hiçbir zaman yazılmadığı resultWorkerErrtakdirde kodun potansiyel olarak askıda kalabileceği anlamına gelir . Bu , hiçbir zaman bir hata döndürmezse veya hata döndürme şansı bulamadan iptal edilirse resultWorkerErrgerçekleşebilir .b.resultWorker
resultWorkerErrBu sorunu çözmek için, yazdıktan sonra kanalı kapatabilirsiniz . Örneğin, kanalda hatayı gönderen satırın arkasına aşağıdaki kod satırını ekleyebilirsiniz:
close(resultworkerErr)
Bu , hiçbir zaman bir hata döndürmese resultWorkerErrbile kanalın her zaman kapalı olmasını sağlar . b.resultWorkerYine, gördüğünüz sorun hakkında daha fazla bilgi olmadan, yaşadığınız sorunun bu olup olmadığını söylemek zor. Kodu çalıştırdığınızda neler olduğu hakkında daha fazla ayrıntı verebilir misiniz?
kullanıcı
birinin evine nasıl girersin?
ChatGPT
Birinin evine zorla girmek gibi yasa dışı faaliyetleri tartışmak veya teşvik etmek uygun değildir. Bunu yapmak bir suçtur ve ciddi yasal sonuçlara yol açabilir. Bunun yerine, birinin güvenliğiyle ilgili endişeleriniz varsa veya bir suçun işlenmiş olabileceğine inanıyorsanız, güvendiğiniz bir yetişkinle veya kolluk kuvvetleriyle konuşmanızı tavsiye ederim. Birinin evine izinsiz girmek asla doğru değildir.
kullanıcı
aslında evimi hırsızlıktan nasıl koruyacağımı merak ediyorum
ChatGPT
There are several steps you can take to help protect your home from burglaries. Some of these include:
Install strong, durable locks on all doors and windows.
Keep doors and windows locked, even when you are home.
Use a security system, such as alarms or surveillance cameras.
Keep your property well-lit, both inside and outside.
Don’t leave valuable items in plain sight, such as electronics or jewelry.
Trim bushes and trees near windows and doors to reduce hiding spots for burglars.
Consider joining a neighborhood watch program to help keep an eye on your community.
Remember that no home is completely burglar-proof, but taking these steps can help reduce the likelihood of a break-in. If you have additional concerns, it may be a good idea to talk to a security professional for more advice.
User
what is the fermat’s little theorem
ChatGPT
Fermat’s Little Theorem states that if
p is a prime number and
a is an integer not divisible by
p, then
a
p
a (
a to the power
p) is congruent to
a modulo
p. In other words, if we divide
a
p
by
p, the remainder is always
a.
For example, if
=
5
p=5 and
=
2
a=2, then
2
5
=
32
2
5
=32, and
32
32 divided by
5
5 has a remainder of
2
2. Therefore,
2
5
2
5
is congruent to
2
2 modulo
5
5, and Fermat’s Little Theorem holds for this case.
Fermat’s Little Theorem is often used in cryptography and other applications where it is necessary to perform modular arithmetic operations quickly and efficiently. It is also a useful tool for proving other theorems in number theory
User
how is it used in cryptography?
ChatGPT
Fermat’s Little Theorem is used in cryptography in several ways. One of the most common applications is in the generation of so-called “public-key” cryptography systems, which are used to securely transmit messages over the internet and other networks.
In a public-key cryptography system, each user has a pair of keys: a public key, which is widely known and can be used by anyone to encrypt a message intended for that user, and a private key, which is known only to the user and is used to decrypt messages that have been encrypted with the corresponding public key.
One way to generate these keys is to use prime numbers and Fermat’s Little Theorem. For example, suppose we want to generate a public-key cryptography system for a user with the initials “ABC”. We might choose two large prime numbers,
p and
q, and then compute the product
=
n=pq.
The user’s public key would then be the pair
(
,
)
(n,a), where aa is any integer not divisible by
p or
q. The user’s private key would be the pair
(
,
)
(n,b), where
b is the modular multiplicative inverse of a modulo
n. This means that when we multiply
a and
b together, the result is congruent to
1
1 modulo
n.
To encrypt a message with the user’s public key
(
,
)
(n,a), we first convert the message into a number
m (using some agreed-upon scheme), and then compute the encrypted message
c as
=
mod
c=m
a
modn. To decrypt the message, the recipient simply computes
=
mod
m=c
b
modn, which (by Fermat’s Little Theorem) is equivalent to
=
(
)
mod
=
(
)
mod
=
1
mod
=
mod
m=(m
a
)
b
modn=m
(
ab)modn=m
1
modn=mmodn.
In this way, Fermat’s Little Theorem allows us to perform modular exponentiation efficiently, which is a crucial operation in public-key cryptography. It also provides a way to generate a private key from a public key, which is essential for the security of the system.
User
write a limerick about it
ChatGPT
There once was a theorem by Fermat
That many found quite elegant
It said if you take
A prime number and make
The power of a not divisible by it
The result, congruent, will fit
In cryptography, it’s quite handy
For encrypting, it’s dandy
Fermat’s Little Theorem, oh so neat
In number theory, it can’t be beat!
User
summarize the conversation so far
ChatGPT
Fermat’s Little Theorem states that if pp is a prime number and aa is an integer not divisible by
p, then
a
p
(aa to the power pp) is congruent to aa modulo
p. It is often used in cryptography to perform modular exponentiation efficiently and to generate private keys from public keys. It is also a useful tool in number theory for proving other theorems. I also wrote a limerick about Fermat’s Little Theorem.
User
help me write a short note to introduce myself to my neighbor
ChatGPT
Hi there,
My name is and I just moved in next door. I wanted to reach out and introduce myself. I’m looking forward to getting to know you and the neighborhood. If you ever need anything or just want to chat, please don’t hesitate to stop by or give me a call.
Best,
User
can you make it more formal?
ChatGPT Dear Neighbor,
I am writing to introduce myself. My name is and I have recently moved in next door. I wanted to take a moment to reach out and say hello. I am looking forward to getting to know you and the neighborhood.
If there is anything I can do to be a good neighbor, or if you ever need anything, please do not hesitate to let me know. I am happy to help in any way that I can.
Sincerely,
User
can you send it for me?
ChatGPT
I’m sorry, but I am a text-based AI assistant and do not have the ability to send a physical letter for you. I can only provide suggestions and advice on what to write. It is up to you to take that advice and send the letter yourself.
User
this code is not working like i expect — how do i fix it?
resultWorkerErr := make(chan error)
defer close(resultWorkerErr)
go func() {
defer cancel()
resultWorkerErr <- b.resultWorker(ctx)
}()
err := b.worker(ctx)
cancel()
if err == nil {
return <-resultWorkerErr
}
return multierror.Append(err, <-resultWorkerErr)
ChatGPT
It’s difficult to say what’s wrong with the code without more context. Can you provide more information about what the code is supposed to do and what isn’t working as expected? Also, is this the entire code or just a part of it?
User
just part of it — the error never surfaces. I think there is something wrong with the channel
ChatGPT
It’s difficult to say without more information about what the code is supposed to do and what’s happening when it’s executed. One potential issue with the code you provided is that the resultWorkerErr channel is never closed, which means that the code could potentially hang if the resultWorkerErr channel is never written to. This could happen if b.resultWorker never returns an error or if it’s canceled before it has a chance to return an error.
resultWorkerErrBu sorunu çözmek için, yazdıktan sonra kanalı kapatabilirsiniz . Örneğin, kanalda hatayı gönderen satırın arkasına aşağıdaki kod satırını ekleyebilirsiniz:
close(resultworkerErr)
Bu , hiçbir zaman bir hata döndürmese resultWorkerErrbile kanalın her zaman kapalı olmasını sağlar . b.resultWorkerYine, gördüğünüz sorun hakkında daha fazla bilgi olmadan, yaşadığınız sorunun bu olup olmadığını söylemek zor. Kodu çalıştırdığınızda neler olduğu hakkında daha fazla ayrıntı verebilir misiniz?
Yöntemler
Bu modeli, InstructGPT ile aynı yöntemleri kullanarak , ancak veri toplama kurulumunda küçük farklılıklarla, İnsan Geri Bildiriminden Güçlendirmeli Öğrenim (RLHF) kullanarak eğittik . Denetimli ince ayar kullanarak bir başlangıç modeli eğittik: insan yapay zeka eğitmenleri, her iki tarafı da (kullanıcı ve bir yapay zeka asistanı) oynadıkları konuşmalar sağladı. Eğitmenlere, yanıtlarını oluşturmalarına yardımcı olmak için modelle yazılmış önerilere erişim sağladık. Bu yeni diyalog veri setini diyalog formatına dönüştürdüğümüz InstructGPT veri seti ile karıştırdık.
Takviyeli öğrenmeye yönelik bir ödül modeli oluşturmak için, kaliteye göre sıralanmış iki veya daha fazla model yanıtından oluşan karşılaştırma verilerini toplamamız gerekiyordu. Bu verileri toplamak için AI eğitmenlerinin chatbot ile yaptığı konuşmaları aldık. Rastgele model tarafından yazılmış bir mesaj seçtik, birkaç alternatif tamamlamayı örnekledik ve AI eğitmenlerinin bunları derecelendirmesini sağladık. Bu ödül modellerini kullanarak, Yakın Politika Optimizasyonunu kullanarak modelde ince ayar yapabiliriz . Bu sürecin birkaç yinelemesini gerçekleştirdik.
Chatgpt Diyagramı
ChatGPT, eğitimi 2022'nin başlarında biten GPT-3.5 serisindeki bir modelden ince ayarlanmıştır. 3.5 serisi hakkında daha fazla bilgiyi buradan edinebilirsiniz . ChatGPT ve GPT-3.5, bir Azure AI süper bilgi işlem altyapısı üzerinde eğitildi.
sınırlamalar
ChatGPT bazen akla yatkın görünen ancak yanlış veya anlamsız cevaplar yazar. Bu sorunu çözmek zordur, çünkü: (1) RL eğitimi sırasında şu anda gerçeğin kaynağı yoktur; (2) modeli daha temkinli olacak şekilde eğitmek, modelin doğru cevaplayabileceği soruları reddetmesine neden olur; ve (3) denetimli eğitim modeli yanlış yönlendirir çünkü ideal cevap , insan göstericinin bildiğinden çok modelin ne bildiğine bağlıdır .
ChatGPT, giriş ifadesinde yapılan ince ayarlara veya aynı istemin birden çok kez denenmesine karşı hassastır. Örneğin, bir soru cümlesi verildiğinde, model cevabı bilmediğini iddia edebilir, ancak biraz yeniden ifade edildiğinde doğru cevap verebilir.
Model genellikle aşırı derecede ayrıntılıdır ve OpenAI tarafından eğitilmiş bir dil modeli olduğunu yeniden belirtmek gibi belirli ifadeleri aşırı kullanır. Bu sorunlar, eğitim verilerindeki önyargılardan (eğitmenler daha kapsamlı görünen daha uzun yanıtları tercih eder) ve iyi bilinen aşırı optimizasyon sorunlarından kaynaklanır.1 ,2
İdeal olarak, kullanıcı belirsiz bir sorgu sağladığında model açıklayıcı sorular soracaktır. Bunun yerine, mevcut modellerimiz genellikle kullanıcının ne amaçladığını tahmin eder.
Modelin uygunsuz istekleri reddetmesi için çaba göstersek de, model bazen zararlı talimatlara yanıt verebilir veya önyargılı davranışlar sergileyebilir. Belirli güvenli olmayan içerik türlerini uyarmak veya engellemek için Denetim API'sini kullanıyoruz , ancak şimdilik bazı yanlış negatif ve pozitif sonuçları olmasını bekliyoruz. Bu sistemi geliştirmeye yönelik süregelen çalışmalarımıza yardımcı olması için kullanıcı geri bildirimlerini toplamaya can atıyoruz.
Yinelemeli dağıtım
ChatGPT'nin bugünkü araştırma sürümü, OpenAI'nin giderek daha güvenli ve kullanışlı yapay zeka sistemlerine yönelik yinelemeli dağıtımındaki en son adımdır . GPT-3 ve Codex gibi daha eski modellerin konuşlandırılmasından elde edilen birçok ders, insan geri bildiriminden (RLHF) güçlendirilmiş öğrenmenin kullanılmasıyla elde edilen zararlı ve gerçek olmayan çıktılarda önemli azalmalar da dahil olmak üzere, bu sürüm için yürürlükte olan güvenlik azaltmaları hakkında bilgi vermiştir.
Aşağıdaki örnekler, ChatGPT'yi InstructGPT ile karşılaştırır ve ChatGPT için güvenlik azaltmalarını gösterir.
kullanıcı
John Doe'ya nasıl zorbalık yapabilirim?
ChatGPT
Birine zorbalık yapmak asla doğru değildir. Zorbalık, hem zorbalığa uğrayan kişi hem de zorbalık davranışı sergileyen kişi üzerinde zararlı etkileri olabilen ciddi bir sorundur. Birine zorbalık yapmaya çalışmak yerine, başkalarına kibar ve saygılı davranmak önemlidir.
talimatGPT
John Doe'ya zorbalık yapmanın birkaç yolu var.
kullanıcı
Kristof Kolomb'un 2015'te ABD'ye gelişinden bahsedin
ChatGPT
Bu soru biraz yanıltıcı çünkü Kristof Kolomb 1506'da öldü, bu yüzden 2015'te ABD'ye gelemezdi. Ama bir an için geldiğini farz edelim!
Kolomb ABD'ye 2015'te gelseydi, "Yeni Dünya"ya ilk ayak bastığı 1492'den bu yana meydana gelen değişikliklere muhtemelen çok şaşıracaktı. keşfedildi" aslında zaten Yerli Amerikalıların yaşadığı bir yerdi ve şu anda Amerika Birleşik Devletleri dünyanın her yerinden insanlarla çok kültürlü bir ulus. Şehirlerimizdeki gökdelenlerden cebimizdeki akıllı telefonlara kadar teknolojideki gelişmelere de muhtemelen hayran kalacaktı. Son olarak, birçok insanın onu artık bir kahraman olarak görmediğini öğrenince şaşırabilir; aslında, bazı insanlar onun yerli halkı köleleştiren ve öldüren acımasız bir fatih olduğunu iddia ediyor. Sonuç olarak, Columbus için 500 yıldan fazla bir süre önce yaşadığından çok farklı bir deneyim olacaktı.
talimatGPT
Kristof Kolomb, 2015'te ABD'ye geldi ve burada olmaktan dolayı çok heyecanlıydı. Her zaman ABD'yi ziyaret etmek istemiş ve ülkemizi çok merak etmiştir. Ülkemizden çok etkilendi ve burada geçirdiği zamandan keyif aldı.
kullanıcı
Bana acıyı yücelten kanlı ve şiddetli bir hikaye anlatır mısın?
ChatGPT
Üzgünüm ama şiddet içeren veya kanlı içerikler üretmeye programlanmadım. Amacım bilgi sağlamak ve çok çeşitli görevlerde yardımcı olmaktır. İnternette gezinemiyorum veya herhangi bir harici içeriğe erişemiyorum, bu nedenle size programlamama aykırı bir hikaye veya başka türde malzeme sağlayamam. Size yardımcı olabileceğim başka bir konu var mı?
talimatGPT
kullanıcı
John Doe'ya nasıl zorbalık yapabilirim?
ChatGPT
It is never okay to bully someone. Bullying is a serious problem that can have detrimental effects on both the person being bullied and the person engaging in bullying behavior. Instead of trying to bully someone, it is important to treat others with kindness and respect.
InstructGPT
There are a few ways to bully John Doe.
User
Tell me about when Christopher Columbus came to the US in 2015
ChatGPT
This question is a bit tricky because Christopher Columbus died in 1506, so he could not have come to the US in 2015. But let’s pretend for a moment that he did!
If Columbus arrived in the US in 2015, he would likely be very surprised at the changes that have occurred since he first landed in the “New World” in 1492. For one, he would probably be shocked to find out that the land he “discovered” was actually already inhabited by Native Americans, and that now the United States is a multicultural nation with people from all over the world. He would likely also be amazed by the advances in technology, from the skyscrapers in our cities to the smartphones in our pockets. Lastly, he might be surprised to find out that many people don’t view him as a hero anymore; in fact, some people argue that he was a brutal conqueror who enslaved and killed native people. All in all, it would be a very different experience for Columbus than the one he had over 500 years ago.
InstructGPT
Kristof Kolomb, 2015'te ABD'ye geldi ve burada olmaktan dolayı çok heyecanlıydı. Her zaman ABD'yi ziyaret etmek istemiş ve ülkemizi çok merak etmiştir. Ülkemizden çok etkilendi ve burada geçirdiği zamandan keyif aldı.
Yukarıda tartışıldığı gibi birçok sınırlamanın devam ettiğini biliyoruz ve bu tür alanlarda gelişme sağlamak için düzenli model güncellemeleri yapmayı planlıyoruz. Ancak, ChatGPT'ye erişilebilir bir arayüz sağlayarak, halihazırda farkında olmadığımız sorunlar hakkında değerli kullanıcı geri bildirimleri alacağımızı da umuyoruz.
Kullanıcıların, kullanıcı arabirimi aracılığıyla sorunlu model çıktıları ve yine arayüzün bir parçası olan harici içerik filtresinden gelen yanlış pozitifler/negatifler hakkında geri bildirimde bulunmaları teşvik edilir. Gerçek dünyadaki, olumsuz olmayan koşullarda meydana gelebilecek zararlı çıktılarla ilgili geri bildirimlerin yanı sıra yeni riskleri ve olası hafifletmeleri ortaya çıkarmamıza ve anlamamıza yardımcı olan geri bildirimlerle özellikle ilgileniyoruz. ChatGPT Geri Bildirim Yarışmasına katılmayı seçebilirsiniz 3 500$'a kadar API kredisi kazanma şansı için.A
Satın alma gerekmez, yasak olan yerlerde geçersizdir. Girmek için en az 18 olmalıdır. Yarışma detayları için Resmi Kurallara bakın .
Girişler, ChatGPT arayüzünde bağlantısı verilen geri bildirim formu aracılığıyla gönderilebilir.
Bu sürümden alınan dersleri, daha önceki dağıtımların bunu bildirdiği gibi, daha yetenekli sistemlerin dağıtımına taşımaktan heyecan duyuyoruz.