Calculer un total courant dans SQL Server

Question

Calculer un total courant dans SQL Server

Demandé el 13 de Mai, 2009: Quand la question a-t-elle été
59799 affichage: Nombre de visites la question a
5 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

Imaginez le tableau suivant (appelé TestTable ) :

id     somedate    somevalue
--     --------    ---------
45     01/Jan/09   3
23     08/Jan/09   5
12     02/Feb/09   0
77     14/Feb/09   7
39     20/Feb/09   34
33     02/Mar/09   6

Je voudrais une requête qui renvoie un total courant dans l'ordre des dates, par exemple :

id     somedate    somevalue  runningtotal
--     --------    ---------  ------------
45     01/Jan/09   3          3
23     08/Jan/09   5          8
12     02/Feb/09   0          8
77     14/Feb/09   7          15  
39     20/Feb/09   34         49
33     02/Mar/09   6          55

Je sais qu'il y a différentes manières de procéder dans SQL Server 2000 / 2005 / 2008.

Je m'intéresse particulièrement à ce genre de méthode qui utilise l'astuce de l'agrégation des ensembles :

INSERT INTO @AnotherTbl(id, somedate, somevalue, runningtotal) 
   SELECT id, somedate, somevalue, null
   FROM TestTable
   ORDER BY somedate

DECLARE @RunningTotal int
SET @RunningTotal = 0

UPDATE @AnotherTbl
SET @RunningTotal = runningtotal = @RunningTotal + somevalue
FROM @AnotherTbl

... c'est très efficace mais j'ai entendu dire qu'il y avait des problèmes autour de cela parce que vous ne pouvez pas nécessairement garantir que la UPDATE traitera les lignes dans l'ordre correct. Nous pourrons peut-être obtenir des réponses définitives à ce sujet.

Mais peut-être y a-t-il d'autres moyens que les gens peuvent suggérer ?

edit : Maintenant avec un SqlFiddle avec la configuration et l'exemple de "mise à jour" ci-dessus

Demandé el 13 de Mai, 2009 par codeulike

0 votes

blogs.msdn.com/sqltips/archive/2005/07/20/441053.aspx Ajoutez une commande par à votre mise à jour ... et vous obtenez une garantie.

Commenté el 30 de Novembre, 2009 par Simon D

0 votes

Mais la commande par ne peut pas être appliquée à une instruction UPDATE... n'est-ce pas ?

Commenté el 1 de Décembre, 2009 par codeulike

0 votes

Voir aussi sqlperformance.com/2012/07/t-sql-queries/running-totals surtout si vous utilisez SQL Server 2012.

Commenté el 22 de Septembre, 2012 par Aaron Bertrand

Answer 1

5 Réponses

Answer 2

150voto

Sam Saffron Points 56236

Mise à jour Si vous utilisez SQL Server 2012, voyez : https://stackoverflow.com/a/10309947

Le problème est que l'implémentation de la clause Over dans le serveur SQL est assez limité .

Oracle (et ANSI-SQL) vous permet de faire des choses comme :

 SELECT somedate, somevalue,
  SUM(somevalue) OVER(ORDER BY somedate 
     ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) 
          AS RunningTotal
  FROM Table

SQL Server ne vous donne aucune solution propre à ce problème. Mon instinct me dit qu'il s'agit d'un de ces rares cas où un curseur est le plus rapide, bien que je doive faire quelques analyses comparatives sur des résultats importants.

L'astuce de mise à jour est pratique mais je pense qu'elle est assez fragile. Il semble que si vous mettez à jour une table complète, la mise à jour se fera dans l'ordre de la clé primaire. Ainsi, si vous définissez votre date comme une clé primaire ascendante, vous obtiendrez les résultats suivants probably être en sécurité. Mais vous vous fiez à un détail d'implémentation non documenté de SQL Server (de plus, si la requête finit par être exécutée par deux procs, je me demande ce qui se passera, voir : MAXDOP) :

Échantillon de travail complet :

drop table #t 
create table #t ( ord int primary key, total int, running_total int)

insert #t(ord,total)  values (2,20)
-- notice the malicious re-ordering 
insert #t(ord,total) values (1,10)
insert #t(ord,total)  values (3,10)
insert #t(ord,total)  values (4,1)

declare @total int 
set @total = 0
update #t set running_total = @total, @total = @total + total 

select * from #t
order by ord 

ord         total       running_total
----------- ----------- -------------
1           10          10
2           20          30
3           10          40
4           1           41

Vous avez demandé une analyse comparative, voici les résultats.

La méthode SAFE la plus rapide serait le curseur, qui est un ordre de grandeur plus rapide que la sous-requête corrélée de la jonction croisée.

Le moyen le plus rapide est l'astuce UPDATE. Mon seul souci est que je ne suis pas certain que, dans toutes les circonstances, la mise à jour se déroule de manière linéaire. Il n'y a rien dans la requête qui le dit explicitement.

En résumé, pour un code de production, je choisirais le curseur.

Données d'essai :

create table #t ( ord int primary key, total int, running_total int)

set nocount on 
declare @i int
set @i = 0 
begin tran
while @i < 10000
begin
   insert #t (ord, total) values (@i,  rand() * 100) 
    set @i = @i +1
end
commit

Test 1 :

SELECT ord,total, 
    (SELECT SUM(total) 
        FROM #t b 
        WHERE b.ord <= a.ord) AS b 
FROM #t a

-- CPU 11731, Reads 154934, Duration 11135

Test 2 :

SELECT a.ord, a.total, SUM(b.total) AS RunningTotal 
FROM #t a CROSS JOIN #t b 
WHERE (b.ord <= a.ord) 
GROUP BY a.ord,a.total 
ORDER BY a.ord

-- CPU 16053, Reads 154935, Duration 4647

Test 3 :

DECLARE @TotalTable table(ord int primary key, total int, running_total int)

DECLARE forward_cursor CURSOR FAST_FORWARD 
FOR 
SELECT ord, total
FROM #t 
ORDER BY ord

OPEN forward_cursor 

DECLARE @running_total int, 
    @ord int, 
    @total int
SET @running_total = 0

FETCH NEXT FROM forward_cursor INTO @ord, @total 
WHILE (@@FETCH_STATUS = 0)
BEGIN
     SET @running_total = @running_total + @total
     INSERT @TotalTable VALUES(@ord, @total, @running_total)
     FETCH NEXT FROM forward_cursor INTO @ord, @total 
END

CLOSE forward_cursor
DEALLOCATE forward_cursor

SELECT * FROM @TotalTable

-- CPU 359, Reads 30392, Duration 496

Test 4 :

declare @total int 
set @total = 0
update #t set running_total = @total, @total = @total + total 

select * from #t

-- CPU 0, Reads 58, Duration 139

Répondu el 14 de Mai, 2009 par Sam Saffron (56236 Points )

1 votes

Merci. Votre exemple de code vise donc à démontrer que la somme sera effectuée dans l'ordre de la clé primaire, je présume. Il serait intéressant de savoir si les curseurs sont toujours plus efficaces que les jointures pour les grands ensembles de données.

Commenté el 14 de Mai, 2009 par codeulike

0 votes

Je suis sûr que vous pouvez trouver des statistiques sur Google ou votre moteur de recherche préféré mais la réponse rapide est que les opérations basées sur les ensembles sont beaucoup plus rapides que les opérations par curseur lorsqu'on travaille avec de grands ensembles de données.

Commenté el 14 de Mai, 2009 par Dan-o

0 votes

@sambo99 - Merci pour tous ces détails supplémentaires.

Commenté el 21 de Mai, 2009 par codeulike

Afficher 12 autres commentaires

Answer 3

129voto

Mikael Eriksson Points 77190

Dans SQL Server 2012, vous pouvez utiliser SOMME() avec le OVER() clause.

select id,
       somedate,
       somevalue,
       sum(somevalue) over(order by somedate rows unbounded preceding) as runningtotal
from TestTable

Fiddle SQL

Répondu el 25 de Avril, 2012 par Mikael Eriksson (77190 Points )

Answer 4

40voto

Roman Pekar Points 31863

Bien que Sam Saffron ait fait un excellent travail dessus, il n'a toujours pas fourni expression récursive du tableau commun pour ce problème. Et pour nous qui travaillons avec SQL Server 2008 R2 et non Denali, c'est toujours le moyen le plus rapide d'obtenir le total courant, c'est environ 10 fois plus rapide que le curseur sur mon ordinateur de travail pour 100000 lignes, et c'est aussi une requête en ligne.
Donc, voilà (je suppose qu'il y a une ord dans la table et il s'agit d'un numéro séquentiel sans discontinuité, pour un traitement rapide, il devrait également y avoir une contrainte unique sur ce numéro) :

;with 
CTE_RunningTotal
as
(
    select T.ord, T.total, T.total as running_total
    from #t as T
    where T.ord = 0
    union all
    select T.ord, T.total, T.total + C.running_total as running_total
    from CTE_RunningTotal as C
        inner join #t as T on T.ord = C.ord + 1
)
select C.ord, C.total, C.running_total
from CTE_RunningTotal as C
option (maxrecursion 0)

-- CPU 140, Reads 110014, Duration 132

<a href="http://sqlfiddle.com/#!3/d41d8/6967" rel="nofollow noreferrer">sql fiddle demo</a>

mise à jour J'étais également curieux de savoir ce qui suit mise à jour avec variable o mise à jour excentrique . En général, cela fonctionne bien, mais comment être sûr que cela fonctionne à chaque fois ? http://www.sqlservercentral.com/Forums/Topic802558-203-21.aspx#bm981258 ) - il suffit de vérifier l'actuel et le précédent ord et utiliser 1/0 au cas où elles seraient différentes de ce que vous attendiez :

declare @total int, @ord int

select @total = 0, @ord = -1

update #t set
    @total = @total + total,
    @ord = case when ord <> @ord + 1 then 1/0 else ord end,
    ------------------------
    running_total = @total

select * from #t

-- CPU 0, Reads 58, Duration 139

D'après ce que j'ai vu, si vous avez un bon index clusterisé/clé primaire sur votre table (dans notre cas, il s'agirait de l'index by ord_id ) la mise à jour se fera toujours de manière linéaire (jamais de division par zéro). Cela dit, c'est à vous de décider si vous voulez l'utiliser dans du code de production :)

actualisation 2 Je mets un lien vers cette réponse, car elle contient des informations utiles sur le manque de fiabilité de cette mise à jour étrange. concaténation nvarchar / index / nvarchar(max) comportement inexplicable .

Répondu el 6 de Décembre, 2012 par Roman Pekar (31863 Points )

6 votes

Cette réponse mérite plus de reconnaissance (ou peut-être a-t-elle un défaut que je ne vois pas ?).

Commenté el 19 de Juin, 2013 par user1068352

0 votes

Il devrait y avoir un numéro séquentiel afin que vous puissiez joindre sur ord = ord + 1 et parfois il faut un peu plus de travail. Quoi qu'il en soit, sur SQL 2008 R2, j'utilise la solution suivante

Commenté el 24 de Juin, 2013 par Roman Pekar

0 votes

+1 Sur SQLServer2008R2 je préfère également l'approche avec le CTE récursif. Pour information, afin de trouver la valeur des tables qui autorisent les écarts, j'utilise une sous-requête corrélée. Cela ajoute deux opérations de recherche supplémentaires à la requête sqlfiddle.com/#!3/d41d8/18967

Commenté el 18 de Août, 2013 par Alexander Fedorenko

Afficher 4 autres commentaires

Answer 5

28voto

Mike Forman Points 1822

L'opérateur APPLY dans SQL 2005 et plus fonctionne pour cela :

select
    t.id ,
    t.somedate ,
    t.somevalue ,
    rt.runningTotal
from TestTable t
 cross apply (select sum(somevalue) as runningTotal
                from TestTable
                where somedate <= t.somedate
            ) as rt
order by t.somedate

Répondu el 5 de Juin, 2009 par Mike Forman (1822 Points )

5 votes

Fonctionne très bien pour les petits ensembles de données. L'inconvénient est que vous devez avoir des clauses where identiques sur les requêtes interne et externe.

Commenté el 12 de Septembre, 2012 par Sire

0 votes

Comme certaines de mes dates étaient exactement les mêmes (à la fraction de seconde près), j'ai dû ajouter : row_number() over (order by txndate) à la table interne et externe et quelques indices composés pour que cela fonctionne. Une solution simple et efficace. BTW, j'ai testé l'application croisée avec la sous-requête ... c'est légèrement plus rapide.

Commenté el 5 de Janvier, 2015 par pghcpa

0 votes

Cette méthode est très propre et fonctionne bien avec les petits ensembles de données ; plus rapide que le CTE récursif

Commenté el 23 de Juin, 2016 par jayoaK

Afficher 1 autres commentaires

Answer 6

11voto

Dan-o Points 12949

SELECT TOP 25   amount, 
    (SELECT SUM(amount) 
    FROM time_detail b 
    WHERE b.time_detail_id <= a.time_detail_id) AS Total FROM time_detail a

Vous pouvez également utiliser la fonction ROW_NUMBER() et une table temporaire pour créer une colonne arbitraire à utiliser dans la comparaison de l'instruction SELECT interne.

Répondu el 14 de Mai, 2009 par Dan-o (12949 Points )

1 votes

C'est vraiment inefficace ... mais là encore, il n'y a pas de moyen propre de le faire dans sql server.

Commenté el 14 de Mai, 2009 par Sam Saffron

0 votes

Il est vrai que c'est inefficace, mais cela permet de faire le travail et il n'y a pas à se demander si quelque chose a été exécuté dans le bon ou le mauvais ordre.

Commenté el 14 de Mai, 2009 par Dan-o

0 votes

Merci, il est utile d'avoir des réponses alternatives, et aussi utile d'avoir une critique efficace.

Commenté el 14 de Mai, 2009 par codeulike

Calculer un total courant dans SQL Server

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Calculer un total courant dans SQL Server

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: