Naja die unterschiedlichen Modelle sind z.T. von unterschiedlichen Firmen und damit auch unterschiedlich trainiert wurden es gibt verschiedene Tests wo die sich dran messen lassen sollen. Aber wie du schon geschrieben hast, gerade bei den kleinen bzw. den fein trainierten Modellen ist es so das sie bestimmte dinge sehr gut können und andere wiederum so gut wie garnicht https://openrouter.ai/rankings
Die meisten LLM's kann man auch einfach fragen z.B.
QuoteIch bin ein LLM (Large Language Model) entwickelt von Phind. Ich assistiere Entwicklern bei komplexen Programmier-, technischen und Informationsaufgaben. Meine Hauptfunktion ist es, in einer VSCode-Erweiterung zu laufen und Entwicklern bei der Arbeit mit Code in einem VSCode-IDE zu helfen.
Der Vorteil bei mintcopilot-1.9 besteht eigentlich darin das du selbst die meisten online LLM's ohne Anmeldung ohne Account etc. nutzen kannst um mal auf die schnelle was zu frage oder ein Bild generieren zu lassen.