2 votes

Comment créer des valeurs Z 2D pour un tracé de surface matplotlib?

Je cherche à créer un graphique de surface de la fonction d'erreur dans la régression linéaire. Je le fais comme ça:

class RégressionLinéaire:
def __init__(self):
    self.data = pd.read_csv("data.csv")

def computeCost(self):
    j = 0.5 * (
        (self.data.hypothesis - self.data.y)**2).sum() / self.data.y.size
    return j

def regress(self, theta0, theta1):
    self.data["hypothesis"] = theta1 * self.data.x + theta0

def plotCostFunction3D(self):
    fig = plt.figure()
    ax = fig.add_subplot(111, projection='3d')

    theta0_vals = np.linspace(-100, 100, 200)
    theta1_vals = np.linspace(-100, 100, 200)
    costs = []

    for theta0 in theta0_vals:
        for theta1 in theta1_vals:
            self.regress(theta0, theta1)
            costs.append(self.computeCost())

    ax.plot_surface(
        theta0_vals,
        theta1_vals,
        np.array(costs),
    )

if __name__ == "__main__":
    regression = RégressionLinéaire()

    regression.plotCostFunction3D()

    plt.show()

Je reçois l'erreur suivante:

ValueError: L'argument Z doit être en 2 dimensions.

Je sais que j'ai besoin d'utiliser np.meshgrid pour theta0_vals et theta1_vals, mais je ne suis pas sûr comment calculer les coûts à partir de ces résultats. Comment devrais-je m'y prendre?

1voto

Arne Points 4751

L'erreur est causée par l'appel de méthode ax.plot_surface(theta0_vals, theta1_vals, np.array(costs)), car Axes3D.plot_surface(X, Y, Z) attend que ses arguments soient des tableaux bidimensionnels.

Comme vous l'avez noté, np.meshgrid() devrait être utilisé pour calculer la grille couverte par theta0_vals et theta1_vals. En ce qui concerne Z, vous avez déjà calculé le coût à chaque point de la grille en utilisant les boucles imbriquées for, il vous suffit donc de transformer la liste unidimensionnelle costs en un tableau bidimensionnel correspondant à la grille X-Y. Cela peut être fait avec np.reshape().

    def plotCostFunction3D(self):
        fig = plt.figure()
        ax = fig.add_subplot(111, projection='3d')

        theta0_vals = np.linspace(-100, 100, 200)
        theta1_vals = np.linspace(-100, 100, 200)
        costs = []

        for theta0 in theta0_vals:
            for theta1 in theta1_vals:
                self.regress(theta0, theta1)
                costs.append(self.computeCost())

        X, Y = np.meshgrid(theta0_vals, theta1_vals)
        Z = np.reshape(costs, (200, 200))

        ax.plot_surface(X, Y, Z)

Pour une meilleure performance, il serait préférable d'éviter les boucles imbriquées for. Vous pourriez stocker les points de la grille X-Y dans un dataframe, puis calculer la colonne Z avec df.apply().

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X