o e«Ïi ã@s^UddlZddlmmZddlmZddlmZgZe e ed<ejj Gdd„dƒƒZdS)éN)ÚTensor)Ú2_scripted_functional_optimizer_deprecation_warningÚ__all__c@s‚eZdZ ddeededededed ed ededed efdd„ZdededBfdd„ZdeedBfdd„Z dS)Ú_FunctionalSGDç{®Gáz„?çFÚparamsÚlrÚmomentumÚ dampeningÚweight_decayÚnesterovÚmaximizeÚforeachÚfusedÚ_allow_empty_param_listcCs|tdd||||dœ|_||_||_||_| |_tj t tj t ttj ffi¡|_t |ƒdkr7| s7tdƒ‚d|i|_dS)Né)Ú stacklevel)r r rrrz%optimizer got an empty parameter listr)rÚdefaultsr rrrÚtorchÚjitÚannotateÚdictrÚstrÚstateÚlenÚ ValueErrorÚparam_group)Úselfrr r rrr rrrr©rúp/var/www/addictedbytheproject.nl/epg/venv/lib/python3.10/site-packages/torch/distributed/optim/functional_sgd.pyÚ__init__s ü$z_FunctionalSGD.__init__ÚparamÚgradNc Cs|jd}|jd}|jd}|jd}|g}g}g} d} |durK| |¡|jr+d} ||jvr5i|j|<|j|}d|vrD| d¡n| |d¡t ¡tj|| ||||||j|j | |j |jddd Wdƒn1sqwY|j|}|d }|dur‰||d<dSdS)z[Similar to self.step, but operates on a single parameter and its gradient. rr rr FNTÚmomentum_buffer©rr r rr rÚhas_sparse_gradrrÚ grad_scaleÚ found_infr)rÚappendÚ is_sparserrÚno_gradÚFÚsgdr rrr) rr"r#rr rr rÚmomentum_buffer_listÚgradsr&rr$rrr Ú step_param:sR òÿ ÿz_FunctionalSGD.step_paramÚ gradientscCs€|jd}g}g}g}|jd}|jd}|jd}|jd} t|ƒt|ƒkr:tddt|ƒ›dd t|ƒ›ƒ‚d } t||ƒD]7\}}|durx| |¡| |¡|jrXd} ||jvrbi|j|<|j|} d| vrq| d¡qA| | d¡qAt ¡t j||||||| |j|j | |j|jddd Wdƒn1sŸwYt|ƒD]\}}|j|} ||}|dur½|| d<q¨dS)Nrr rr rzEthe gradients passed in does not equal to the size of the parameters!zParams length: z. zGradients length: FTr$r%)rrrrÚzipr)r*rrr+r,r-r rrrÚ enumerate)rr1rÚparams_with_gradr/r.r rr rr&r"ÚgradientrÚiÚpr$rrr Ústeplsn ÿþÿ € òÿ €üz_FunctionalSGD.step) rrrrFFFFF) Ú__name__Ú __module__Ú__qualname__ÚlistrÚfloatÚboolr!r0r8rrrr rsBõþýüûúùø ÷ ö õ!2r)rÚtorch.optim._functionalÚoptimÚ_functionalr,rÚ,torch.distributed.optim._deprecation_warningrrr<rÚ__annotations__rÚscriptrrrrr Ús