Pengembang yang menggunakan Responses API dapat mengakses model yang sama dengan pencarian Power ChatGPT: Pencarian GPT-4O dan pencarian mini GPT-4O. Model -model ini dapat menelusuri web untuk menjawab pertanyaan dan mengutip sumber dalam tanggapan mereka.
Itu penting karena Openai mengatakan kemampuan pencarian web yang ditambahkan secara dramatis meningkatkan akurasi faktual model AI -nya. Pada benchmark SimpleQA Openai, yang bertujuan untuk mengukur tingkat konfabulasi, pencarian GPT-4O mencetak 90 persen, sementara pencarian mini GPT-4O mencapai 88 persen-keduanya secara substansial mengungguli model GPT-4.5 yang lebih besar tanpa pencarian, yang mendapat nilai 63 persen.
Terlepas dari perbaikan ini, teknologi ini masih memiliki keterbatasan yang signifikan. Selain masalah dengan CUA yang menavigasi situs web dengan baik, kemampuan pencarian yang ditingkatkan tidak sepenuhnya menyelesaikan masalah confabulation AI, dengan pencarian GPT-4O masih membuat kesalahan faktual 10 persen dari waktu.
Bersamaan dengan respons API, OpenAI merilis agen open source SDK, menyediakan alat gratis pengembang untuk mengintegrasikan model dengan sistem internal, mengimplementasikan perlindungan, dan memantau kegiatan agen. Toolkit ini mengikuti rilis Openai sebelumnya dari Swarm, kerangka kerja untuk mengatur beberapa agen.
Ini masih hari -hari awal di bidang agen AI, dan hal -hal kemungkinan akan membaik dengan cepat. Namun, pada saat ini, gerakan agen AI tetap rentan terhadap klaim yang tidak realistis, seperti yang ditunjukkan awal pekan ini ketika pengguna menemukan bahwa platform agen AI AI Effect AI AI Gagal Memberikan banyak janji, menyoroti kesenjangan yang persisten antara klaim promosi dan fungsionalitas praktis dalam kategori teknologi yang muncul ini.